Займите место моему 3D-персонажу у сцены: какое будущее ждет видеозвонки
Распознавание эмоций собеседника
Call-центры уже давно используют технологию распознавания эмоций (ER — emotional recognition) на базе искусственного интеллекта. Алгоритмы помогают понять, доволен ли клиент, дают подсказки операторам, анализируют эффективность звонков. Теперь похожие технологии пытаются применить и к видео-конференц-связи (ВКС).
Среди самых известных игроков — стартапы Sybill и Uniphore. Последний уже привлек несколько раундов инвестиций и оценивается в $2,5 млрд. Кроме того, есть приложения для Zoom с похожими возможностями. Например, MorphCast с функцией оценки вовлеченности, внимания и других подобных параметров.
Такое ПО опирается на несколько технологий — компьютерное зрение, распознавание речи, обработку естественных языков и эмоциональный ИИ. Они позволяют улавливать поведенческие сигналы собеседника, такие как тон голоса, движение глаз, мимика.
Разработчики MorphCast описывают несколько потенциальных сценариев использования ER в ВКС. К примеру, можно оценивать результативность видеопрезентаций или эмоциональный настрой участников во время групповых звонков или корпоративных собраний.
Но ученые относятся к этому настороженно. Проявления эмоций зависят от культуры, ситуации и конкретного человека, напоминает профессор Университета Южной Каролины и старший научный сотрудник Microsoft Research Кейт Кроуфорд.
Microsoft уже заявила, что отказывается от распознавания эмоций в своих решениях из-за спорной эффективности технологии. Правозащитные организации попросили Zoom сделать то же самое.
Поставщики ER-приложений обещают со временем усовершенствовать технологию и следить за корректностью работы ПО. Но даже если вопрос с эффективностью удастся решить, ER в ВКС необязательно станет массовым, считает Антон Анпилов, руководитель команды SberJazz (платформа видеоконференций от «Сбера»). По его словам, намного более перспективная ниша — развитие коммуникативных навыков сотрудников. В будущем с помощью ER можно анализировать, как участники команд строят встречи, взаимодействуют с коллегами. Но для этого потребуются более сложные и тонко настроенные решения.
Цифровые аватары как помощник или замена человека на встречах
Усталость от видеоконференций (Zoom fatigue) испытывают не только удаленные сотрудники. Поскольку многие организации выбрали гибридный формат, даже в офисе люди вынуждены проводить много часов за видеозвонками с коллегами, работающими дистанционно.
Ученые из Стэнфордской лаборатории виртуальной реальности называют четыре причины такой усталости:
- слишком много зрительного контакта;
- напряжение от необходимости смотреть на себя;
- ограниченная подвижность перед экраном;
- высокая когнитивная нагрузка при определении невербальных сигналов собеседника.
Почти все эти проблемы решаются с помощью цифровых аватаров, заменяющих человека на видеозвонках.
Крупные поставщики ВКС-решений уже обеспечили своим пользователям такую возможность. И даже предложили заменить себя на цифровую собачку или кролика, чтобы совещания были менее скучными. Такие изображения могут передавать базовые эмоции, считывая голосовые сигналы и эмодзи-команды.
Некоторые обозреватели называют цифровые аватары для видеозвонков одним из самых бесполезных обновлений в истории ВКС. Антон Анпилов тоже считает, что в классических видеоконференциях «такой формат не самый востребованный», но описывает другой интересный сценарий.
«Цифровой аватар необязательно воспринимать как замену человека. В перспективе он может выступать в роли ИИ-помощника. Скажем, присутствовать на видеозвонке вместо сотрудника, фиксировать для него какую-то информацию или позвать на совещание, когда тот понадобится», — говорит эксперт. Это решит в том числе и проблему Zoom fatigue.
Тем не менее аватары уже завоевали прочное место в соцсетях и электронной коммерции именно как замена реального человека. К примеру, китайские бренды используют дипфейки блогеров для продвижения своих продуктов в режиме 24/7.
По мере развития решений, внедрения ИИ для создания более реалистичных и персонализированных аватаров сфера их использования расширится, уверены в Dell. «Например, учителя смогут использовать аватары для проведения виртуальных занятий, а врачи — для дистанционных консультаций», — считают аналитики компании.
XR, VR и AR — от сцены для презентаций до метавселенной
Еще во время пандемии небольшие компании начали проводить встречи в виртуальной реальности. Для этого они использовали многопользовательские игры вроде ковбойского шутера Red Dead Redemption.
Конечно, были некоторые технические накладки. Участники иногда путали команды «сесть на землю» и «придушить соседа», потому что за них отвечает одна и та же кнопка. А вокруг могли ходить неигровые персонажи и играть на губной гармошке. Но для небольших команд с неформальной корпоративной культурой это не было проблемой.
Спустя пару лет производители игр всерьез заинтересовались организацией виртуальных встреч. Так, платформа Roblox, которая позволяет пользователям создавать собственные игры в разных жанрах, недавно выпустила анимированное решение для видеозвонков. Разработчики обещают, что научат пользовательские аватары точно отслеживать и передавать выражение лиц вплоть до частоты моргания.
Поставщики ВКС-решений тоже экспериментируют с расширенной реальностью. Например, разработчики SberJazz предложили своим пользователям с бизнес-лицензиями протестировать новый формат встреч — SberJazz XR. Он дает возможность создавать встречи в виртуальном окружении с анимированными 3D-персонажами, которые могут передвигаться в пространстве и взаимодействовать между собой, например поднимать руку, чтобы взять слово, показывать жестами реакции и многое другое. Пока такие встречи доступны только на ПК и рассчитаны на 50 аватаров, а остальные участники могут присоединиться к ним в привычном аудио- и видеоформате.
Встреча с использованием XR-технологий позволяет проводить яркие презентации и создавать новый клиентский опыт, чтобы повысить лояльность и доверие к бренду. А сотрудники компании, работающие в гибридных командах, получают новый инструмент, чтобы делиться идеями на расстоянии, но при этом иметь возможность отдыхать от камеры и не терять контакт с собеседниками. Также использование SberJazz XR поможет добавить элементы игры и ощущения присутствия в онлайн-обучение в небольших группах.
Тестируются и другие сценарии массового применения встреч в расширенной реальности, в том числе VR. Но пока одно из существенных ограничений для VR-функционала ВКС — слишком дорогие девайсы. Apple представила новую гарнитуру стоимостью около $3,5 тыс. (начало продаж ожидается в марте 2024 года), то есть более ₽310 тыс. по состоянию на конец ноября 2023 года. Но со временем устройства могут подешеветь, особенно когда на рынке появятся китайские аналоги.
Следующий этап — полное перемещение видеокоммуникаций в виртуальное пространство и интеграция метавселенной в рабочую среду. По прогнозам Bain & Company, первые кандидаты на такую интеграцию — подростки, которым сейчас по 13–17 лет. Они настолько привыкли к AR- и VR-технологиям, что их будущим работодателям придется с этим считаться.
В Gartner ожидают, что в ближайшие пять лет 30% инвестиций в метавселенные будут направлены именно на переосмысление рабочего пространства. То есть на эти цели корпорации потратят около $1 млрд.
Голограмма на совещании
«Не успел я опомниться, как в мою спальню вошел инженер. Это было настолько убедительно, что я почувствовал себя неловко из-за кучи одежды в моей комнате. Призрак был виден только мне — он отображался через линзы очков дополненной реальности, которые я надел», — описывает свой первый опыт общения с голограммами в AR журналист Bloomberg Броуди Форд.
Компания Cisco (производитель гарнитуры, которую испытывали в Bloomberg) утверждает, что сегодня уже есть достаточная технологическая база для практичной и удобной голографической коммуникации. У гарнитур хватает мощности, а у сетей — пропускной способности.
Общаться с голограммами через AR-очки предлагает и Microsoft. Еще более эффектный, но и более сложный с технической точки зрения вариант — голографические кабины. Так, платформа Starline от Google создает 3D-модель собеседника и проецирует ее на прозрачный экран.
«Производители показали несколько интересных решений, однако они больше похожи на научные эксперименты, чем на рыночные продукты. И все же сейчас технология ближе к выходу на массовый рынок, чем когда-либо, считает футурист Ричард ван Хойдонк.
«Потенциал применения в коммуникациях ошеломляет. Возможность общаться в режиме реального времени с реалистичной голограммой коллеги, клиента или любимого человека в натуральную величину может почти полностью устранить барьер, созданный расстоянием», — отмечает Хойдонк.
Пользователям интересны реалистичные форматы, и перспективы голограмм для ВКС действительно огромные, соглашается Анпилов. Но чтобы их реализовать, необходимы удобные миниатюрные устройства, которые можно запускать в любом офисе или дома. «Когда мы будем заходить в конференц-зал и занимать место для голограммы коллеги, это будет означать, что голографическое будущее ВКС наступило», — заключает эксперт.