Как искусственный интеллект меняет видео-конференц-связь

Фото: Dalle-3
Фото: Dalle-3
Искусственный интеллект помогает оптимизировать многие рабочие задачи. Рассказываем, как с помощью ИИ растет эффективность систем видео-конференц-связи

Видеоконференции стали популярны во время пандемии COVID-19. Сейчас этот вид коммуникации продолжает пользоваться спросом. Это подтверждает объем рынка видео-конференц-связи (ВКС). Он к 2030 году увеличится вдвое и составит $17 млрд, подсчитала аналитическая компания Fortune business insights. Одним из драйверов роста эксперты называют использование технологий ИИ.

Бизнес во всем мире делает ставку на развитие генеративного ИИ, который способен анализировать данные, обучаться, а затем создавать новый контент. В совместном исследовании консалтинговой компании «Яков и партнеры» и «Яндекса» отмечается, что благодаря генеративному ИИ стало возможно решать задачи принципиально нового класса: писать связные тексты, суммаризировать информацию, создавать изображения, анализировать видео. Исследователи компании OpenAI и Пенсильванского университета выяснили, что в США 80% сотрудников компаний решают 10% своих рабочих задач с помощью генеративного ИИ.

Улучшение звука и видео

В числе устойчивых трендов на рынке ВКС упоминаются технологичность и удобство решений. Пользователи предъявляют высокие требования к качеству трансляции. Встречи в условиях распределенного офиса проходят эффективнее, если не нужно отвлекаться на настройку звука и изображения.

Многие платформы ВКС предлагают решения на основе ИИ: настройки помогают автоматически заглушать посторонние шумы или улучшать видео. Например, интеллектуальная функция в Zoom размывает фон или меняет его и позволяет разместить за спиной докладчика любую картинку. Также программа обнаруживает и удаляет посторонние шумы, например звук набора текста на клавиатуре.

Евгения Лампадова, Founder&CEO коммуникационного агентства LAMPA

«В агентстве для ускорения или оптимизации рабочих процессов мы уже задействуем ИИ-инструменты, но пока без фанатизма. На этом этапе развития сервисов ИИ зачастую требуется немало времени и усилий, чтобы настроить необходимые алгоритмы, а гарантий отсутствия ошибок пока нет. Тем не менее во время видеоконференций нас уже выручают функции шумоподавления (если соседи вдруг затеяли ремонт) или технология «умного» размытия фона, чтобы участники звонка могли полностью сфокусироваться на спикере (а не на деталях интерьера за его спиной, например)».

Платформа для коммуникаций TrueConf предлагает еще несколько вариантов улучшения трансляции. При автофокусировке алгоритм обнаруживает лица пользователей и размещает их в центре кадра, удаляя ненужное пространство. Также есть функция, при которой алгоритм на основе ИИ объединяет в одном кадре нескольких пользователей, которые находятся на расстоянии друг от друга.

Фото:Алексей Никольский / ТАСС
Индустрия 4.0 Видеоконференцсвязь: как это работает и какую программу выбрать

Транскрипция и перевод

Издание Harvard Business Review отмечает, что генеративный ИИ делает онлайн-встречи более эффективными, так как адаптирует их под разные способы восприятия информации. Одним людям легко работать с аудиальным контентом, другим проще следить за мыслью в тексте. Полезная функция на основе ИИ — технология, которая в режиме реального времени переводит речь в текст для создания субтитров. Так, инструмент Rewatch AI интегрируется в разные сервисы видеозвонков и автоматически создает стенограмму собрания.

Следующий шаг — синхронный перевод. Докладчик может говорить на английском, при этом стенограмма будет сразу переведена на русский. Кроме того, есть возможность оставить в субтитрах оба языка. Такая функция используется не только в Rewatch AI, но и на других популярных платформах ВКС.

Функция суммаризации

Эксперты сходятся во мнении, что 2023-й стал годом взрывного роста инструментов генеративного ИИ. С ними сталкивались 78% респондентов — людей, занятых в разных индустриях, подсчитала консалтинговая компания McKinsey. При этом 22% опрошенных регулярно используют его в работе. Одно из ИИ-решений, которое упрощает взаимодействие внутри компании, — это функция суммаризации. Так называется автоматическое преобразование текста, при котором убираются все незначительные подробности и остаются только основные идеи.

Консалтинговая компания Forrester отмечает положительный экономический эффект функции суммаризации, которая есть в пакете услуг Microsoft Teams Premium. Это освобождает время сотрудников на решение более важных задач. Аналитики подсчитали, что у работников высвобождается около пяти часов в неделю, которые обычно тратятся на выяснение содержания пропущенных видеовстреч. Кроме того, суммаризация снижает количество ошибок из-за забытых задач или потерянной информации: все договоренности легко освежить в памяти, так как они перечислены в конспекте.

У интеллектуального чат-помощника Zoom AI Companion также есть функция суммаризации, пользователям AI Companion доступны резюме обсуждения и переписок в чатах.

Максим Никитин, управляющий партнер Агентства специальных поручений

«Современное развитие инструментария на базе ИИ значительно облегчает жизнь уже сейчас. Большая часть людей предпочитает выражать свои мысли устно, а с популяризацией видеоплатформ и видеоконтента в социальных сетях на плечи пиарщиков легла большая задача по расшифровке, то есть переводу речи в текст с его последующей обработкой. В этом смысле нас спасают появившиеся сейчас различные сервисы, которые могут быстро и безболезненно переформатировать как аудио, так и видеофайлы в разборчивый и довольно грамотный текст. Человеку остается только отредактировать стилистику и выбрать смыслы, которые он решил транслировать. Отдельное место в нашей деятельности заняли такие сервисы, как ChatGPT и GigaChat. Это наши незаменимые помощники в работе. Они стали собеседниками и ассистентами, которым можно доверить первичный сбор или обработку информации. Эти инструменты отлично справляются с распределением контента по тематическим блокам и вычленением сутевых фактов».

Среди российских вендоров функцию суммаризации одной их первых реализовала компания SberDevices в платформе для видеоконференций SberJazz. Инструмент автоматического создания резюме встречи разработан на базе технологий нейросетевой модели GigaChat. По итогам онлайн-собрания ИИ формирует выжимку с наиболее важными фрагментами видеозвонка: ключевыми темами, задачами и важными комментариями. Пользователь может скопировать необходимую информацию из готового документа, скорректировать по своему усмотрению и отправить коллегам. Полезна эта функция и для сотрудников, которые по каким-то причинам не смогли присоединиться к встрече. С помощью суммаризации они могут за несколько минут ознакомиться с ключевыми моментами собрания. Это существенно повышает эффективность всего рабочего процесса.

Фото:Freepik
Индустрия 4.0 Приватно и технологично: 7 трендов на рынке видеоконференцсвязи

Аналитика встреч

Для ВКС разрабатываются решения на основе ИИ, позволяющие распознавать эмоции. Компания MorphCast создала продукт, который фиксирует тон голоса, движение глаз и мимику участников видеовстречи. С помощью этого можно оценить успешность выступления и вовлеченность людей. Потенциально такой инструмент улучшит взаимодействие внутри команды.

Татьяна Бабич, технический директор компании Nord Clan

«Как компания — разработчик ПО, мы видим потребность рынка в видеоаналитике на уровне продаж. Сотрудники по-разному презентуют продукты и услуги. Нужно отслеживать, какие действия команды привели к удачной сделке, и внедрять их в обучение новичков. Это позволит увеличить конверсию».

На базе ИИ работает специализированное программное обеспечение для команды продаж — Zoom Revenue Accelerator. Оно анализирует содержание всех онлайн-встреч с клиентами. Программа составляет конспект разговоров, оценивает вовлеченность участников встречи, предлагает варианты вопросов и дальнейших действий. На основе этих данных можно сократить цикл заключения сделок и улучшить прогнозируемость дохода.

Компания планирует расширить спектр возможностей Zoom Revenue Accelerator и включить в него виртуального тренера, который будет обучать отделы продаж, имитируя настоящие переговоры с клиентом. Еще одна перспективная функция — предупреждения о рисках сделок. Алгоритм будет присылать уведомления, если заметит, что переговоры продвигаются не так успешно, как ожидалось.

ИИ-дублер

В августе 2023 года компания Google анонсировала разработку Duet AI. Этот помощник будет интегрирован во все приложения Workspace, включая сервис видеоконференций Google Meet. Базовая функция Duet AI — автоматически создавать резюме встречи и рассылать его участникам. Но этот помощник способен самостоятельно ходить на собрания. По утверждению разработчиков, пользователь сможет отправить Duet на онлайн-встречу. Там он сгенерирует текст о том, что хотелось бы обсудить, и ответит на вопросы. Но если все участники собрания решат отправить вместо себя виртуального помощника, Meet автоматически завершит встречу. Внедрить такую функцию компания планирует в течение 2024 года.

Обновлено 11.03.2024
Главная Лента Подписаться Поделиться
Закрыть