Тренды в сфере искусственного интеллекта
Игорь Пивоваров, организатор OpenTalks.AI и главный аналитик Центра искусственного интеллекта МФТИ, отметил четыре главных тренда для ИИ и бизнеса:
- Компании все реже делятся реальными кейсами. Причина — в осторожности по отношению к данным и распространение технологии распознавания лиц, с безопасностью которой все еще более неоднозначно.
- Монополия больших корпораций на большие данные и разработки в области ИИ.
- Ужесточение регулирования отрасли. Государство вводит все более суровые ограничения, действует в интересах монополий и неохотно рассказывает о собственных проектах в области ИИ.
- RL (reinforcement learning, обучение с подкреплением) — главное конкурентное преимущество российских разработчиков на международном рынке.
Сергей Лукашкин, директор по управлению проектами цифровой трансформации ВТБ, рассказал том, как ИИ повлиял на бизнес в 2020 году.
Вот главные факторы:
- Объем загружаемых и хранимых данных в мире вырос в 33 раза: с 1,2 Збайта (1,2 трлн Гб) в 2010 году до 40 Збайт в 2020-м. Эти данные используют в качестве датасетов для обучения ИИ.
- Рост вычислительных мощностей — благодаря тому, что стоимость вычислений упала на 98%: с $1,8 за гигафлопс (единица измерения мощности, выраженная в операциях в секунду) в 2011 году до $0,03 в 2020-м.
- Тренд на цифровизацию бизнеса во всех отраслях;
- Пандемия COVID-19.
В каких направлениях быстрее всего развиваются ИИ-технологии
⚕️ Медицина и биология
Благодаря пандемии и технологиям на базе ИИ в этой сфере произошел небывалый прорыв. Так, ИИ AlphaFold от DeepMind расшифровал процесс сворачивания белка — это задача, над которой ученые бились 50 лет. Имея 3D-модель структуры белка, можно лечить многие заболевания и разрабатывать новые лекарства.
Искусственный интеллект помогает бороться с COVID-19. Например, платформа Open AI Consortium использует ИИ, который обучается на медицинских данных о коронавирусе, чтобы прогнозировать распространение пандемии и загрузку медперсонала, а также предлагать наиболее эффективные методы лечения.
Компьютерное зрение, которое лежит в основе работы сервисной платформы Care Mentor AI, помогает обнаруживать признаки COVID-19 на снимках КТ с точностью до 90%, тогда как врачи — всего лишь до 70%.
Алексей Чернявский, старший научный сотрудник Philips Innovation Labs, рассказал, что нейросетевые алгоритмы также помогают избавляться от «шума» и других искажений на снимках КТ, которые возникают из-за движения, помех или металлических имплантов. Компьютерное зрение позволяет удалить артефакты и дорисовывает недостающие данные. В итоге можно сократить время пребывания пациента в томографе и снизить дозу облучения до 25% от обычной.
Scanderm — российское приложение для онлайн-диагностики заболеваний кожи по фото, которое работает на базе машинного обучения. Приложение, в том числе, распознает сыпь при COVID-19.
Сейчас ИИ полезен не только в деле борьбы с пандемией, но и со старением и сложными болезнями. Например, ИИ-сервис GeroSense помогает бороться со старением. Это приложение для смартфона, которое собирает показатели с фитнес-трекеров — количество шагов, физическую активность, давление, пульс — и анализирует их за определенный период времени. На основе этих данных GeroSence делает выводы о биологическом возрасте пользователя и разрабатывает персональные рекомендации по образу жизни и физическим нагрузкам.
💣 Кибербезопасность
За время пандемии количество кибератак заметно выросло, но ИИ помогает с ними справляться.
В частности, Андрей Арефьев, директор по инновационным продуктам компании InfoWatch, которая специализирующаяся на информационной безопасности в корпоративном секторе, рассказал, что машинное обучение помогает закрывать уязвимости, которым в ИТ-службах уделяют очень мало внимания. Например, некоторые сотрудники перед увольнением копируют целые базы клиентов и технические разработки — службы информационной безопасности редко когда задумываются об этом. Ущерб от каждого такого случая может составить годовую зарплату уволенного. Алгоритм распознает типичные признаки того, что сотрудник планирует уволиться: снижение продуктивности, посещение определенных сайтов и прочие. Для этого специальное ПО в локальной сети собирает скриншоты экрана, отслеживает действия с базами данных, переписку в мессенджерах, историю браузера. За месяц до предполагаемого увольнения ИИ оповещает ИТ-службу о возможных рисках.
👁️ Компьютерное зрение
В 2020 распознавание лиц начали использовать для борьбы с пандемией: чтобы отслеживать больных на самоизоляции, выявлять людей без масок или с признаками простуды. Это подстегнуло развитие технологии.
Технология DFI на базе CV (computer vision) позволяет распознавать лица даже в масках. Она делает это с помощью 14 точек на лице, по которым можно идентифицировать человека. Теперь границы приватности сузились еще больше.
Еще одно перспективное направление — 3D-сцены, которые создаются при помощи компьютерного зрения. С помощью нейросетей можно генерировать 3D-модели на основе нескольких фотографий или панорамного снимка.
Создание 3D-сцен востребовано в строительстве, дизайне интерьера, военном деле, анимации, а также AR и VR. Нейросеть NeRF от Google Brain и Google Research воссоздает объемные объекты на фотографиях, достраивая их глубину, оттенки цвета и текстуру, с учетом точки обзора.
В Голливуде используют технологию, чтобы смоделировать освещение, расположение актеров и декораций, сэкономив на технически сложных съемках.
Подробнее — в материале «Что такое компьютерное зрение и где его применяют».
Еще один тренд — дипфейки — реалистичные видео, которые создаются на основе фото и видео реального человека, но помещают его в вымышленную ситуацию, иногда даже воспроизводят вымышленную речь. Теперь они становятся новой реальностью: наступает эпоха постправды, когда сгенерированные изображения известных личностей заменяют реальные. Это ставит перед нами новые этические проблемы. МВД России уже объявило тендер на разработку технологии, которая способна распознавать дипфейки.
🏭 Промышленность
В производстве появились полностью автономные самообучающиеся роботы, системы на базе интернета вещей, цифровые двойники. Например, BMW и Nissan используют сервисы на базе ИИ на финальном этапе сборки, чтобы убедиться, что у автомобиля нет дефектов и он полностью соответствует нужным техническим характеристикам. General Motors применяет «умные» камеры для роботов, чтобы выявлять дефекты и отказы системы еще на этапе сборки.
Еще одно популярное в промышленности направление — генеративный дизайн, когда ИИ создает продукт без участия человека. Это позволяет выпускать более прочные материалы, экономя сырье. Таким образом предприятия становятся все более автономными, лучше адаптируются к изменениям рынка, прогнозируют качество и доходность. К примеру, Volkswagen использует генеративный дизайн при создании некоторых моделей автомобилей.
🛒 Ретейл
Торговля все больше переходит в онлайн-формат, а в рознице наблюдается устойчивый тренд на бесконтактные технологии. При этом онлайн и офлайн все больше смешиваются за счет активного развития доставки и приложений, которые помогают совершать покупки в обычном супермаркете. Так, появились «умные» весы, ценники, чат-боты и цифровые помощники, оплата по лицу и дополненная реальность.
Мировой тренд на магазины без персонала дошел и до России: первые точки уже запустили «Азбука Вкуса» и X5 Retail Group. В США уже пять лет работают Amazon Go — магазины, где выбирать и оплачивать товары можно через приложение, которое распознает покупателей по лицу. В самих магазинах тоже установлены камеры, которые идентифицируют посетителей и следят, какие товары они взяли и в каком количестве. Пока что главная проблема российских проектов — это воровство, но и тут помогают разработки на базе ИИ с распознаванием лиц.
Сергей Захаров, CEO компании CERA, разработчика ИИ-решений для ретейла, рассказал, как работает их система распознавания лиц и объектов в офлайн-магазинах:
- отслеживает очереди и перенаправляет покупателей на другую кассу, чтобы ускорить процесс;
- распознает товары на полке и следит, чтобы они были правильно расставлены (включая положение этикетки) и не заканчивались;
- наблюдает за покупателями, анализируя, как они выбирают товар с привязкой к полу и возрасту;
- помогает отслеживать магазинные кражи.
📚 Образование
Пандемия привела к росту онлайн-обучения и внедрению в образовательную сферу новейших технологий. В результате, в Сети накопились большие массивы данных — так называемый «цифровой след». По словам Сергея Лукашкина из ВТБ, существуют алгоритмы на базе ИИ, которые собирают данные об обучающихся в цифровые профили. Затем технология анализирует их по нескольким параметрам, сравнивая карьерные успехи и достижения. В ближайшем будущем эти данные можно будет использовать для персональных рекомендаций: чего не хватает человеку для успешной карьеры и каковы его перспективы на рынке труда. А также — предлагать пользователям онлайн-курсы, которые им подойдут.
Одновременно с этим вырос спрос на профессии, которые сочетают в себе знания в области ИТ и soft skills — такие, как умение работать в команде, аналитическое мышление, кризис-менеджмент — а также на профессии, которые связаны с ИИ и роботами.
Главные проблемы онлайн-обучения — отсутствие живого контакта с преподавателем, а также контроля над тем, как учащийся выполняет задания и онлайн-тесты. Мария Машкеева, директор по развитию бизнеса компании «Электронные платформы», представила на конференции «Экзамус» — сервис на базе распознавания лиц.
Нейросеть в основе сервиса наблюдает за студентами во время онлайн-экзамена: сравнивает их лицо с фотографией и идентифицирует по почерку, чтобы убедиться, что это тот же человек. «Экзамус» замечает, если студент вышел из кадра, подглядывает или обращается к кому-то постороннему. Обо всех нарушениях система сообщает сотруднику, который проводит экзамен и контролирует соблюдение всех правил.
💳 Финтех
Главные тренды — это бесшовные транзакции и «невидимый» банкинг: когда вы даже не замечаете, что пользуетесь банковскими услугами. Например, Тинькофф Банк использует гиперперсонализацию: ИИ предугадывает потребности клиента на основе данных о нем и предлагает нужные сервисы.
ИИ также помогает банкам прогнозировать риски и анализировать геоданные, чтобы применять их для открытия новых точек и запуска новых продуктов. В Сбербанке ИИ позволяет на 95% автоматизировать процесс выдачи кредита.
⚖️ Юриспруденция
В отличие от Legal Tech, который объединяет любые онлайн-инструменты для автоматизации рутинных действий, ИИ — то есть Legal AI — помогает юристам решать более сложные задачи и через 10-15 лет может вовсе вытеснить их из профессии.
Однако для юридической практики большинство NLP-решений (NLP, Natural Language Processing — круг задач по обработке текстов на естественном языке) не работают из-за особенностей языка и специфических задач. До сих пор нет готовых датасетов для обучения нейросетей в этой сфере. Поэтому на данный момент главная задача в Legal AI — научить ИИ понимать значение юридических формулировок.
Команда по робототехнике и искусственному интеллекту «Старкит» при МФТИ показала футбольный матч двух команд автономных роботов. Они оснащены камерами, которые распознают разметку, соперников и положение мяча. Роботы сами принимают решения, исходя из знания правил, ситуации на поле и действий других участников. Вместе с аналогичными моделями они участвуют в международных футбольных чемпионатах.
Главная цель — добиться, чтобы к середине XXI века команда полностью автономных человекоподобных роботов смогла выиграть у команды-победителя последнего чемпионата мира матч, соответствующий официальным правилам ФИФА.
NLP: что интересного произошло за год в распознавании текста
Григорий Сапунов, технический директор Intento — компании-разработчика ИИ-решений для работы с контентом и переводами, поделился главными событиями в области NLP за 2020 год.
🧠 Прорыв в обучении GPT-3 — нейролингвистической сети, которая генерирует связные ответы в диалоге с человеком. Объем используемых ей данных и параметров в 100 раз превосходит предыдущее поколение — GPT-2. Сейчас такие нейросети использует, например, «Сбер».
👾 Тренд на большие трансформеры — то есть, нейросети, которые используют механизм внимания, вычленяя в тексте важные смысловые куски. Также трансформеры умеют обрабатывать разные куски текста. В результате можно переводить большие объемы гораздо быстрее, не дожидаясь, пока алгоритм прочитает фразу от начала до конца. Трансформеры применяют, в частности, в Google Переводчике. Теперь их успешно используют в «Яндекс.Переводчике» и «Яндекс.Новостях».
📄 Совершенствование популярных чат-ботов. Meena от Google или BlenderBot от Facebook заметно усовершенствовали: они научились понимать гораздо больше слов и даже учитывать контекст разговора. Чат-бот Emora — победитель Alexa Prize в 2020 году — установил новый рекорд: 20 минут осмысленного разговора и оценка 4 по пятибалльной шкале от судей.
🌐 Обострились глобальные проблемы, связанные с ИИ. Cоздание и обучение нейросетей обходится в миллионы долларов, и позволить себе это могу пока лишь крупные корпорации. Также появляются исследования, которые указывают на экологическую угрозу: выбросы СО2 в процессе обучения сложных нейросетей в шесть раз превышают выбросы от автомобиля за весь его срок службы.
Подписывайтесь также на Telegram-канал РБК Трендов и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.