Давид Ян — РБК: «В мире появится движение Robot lives matter»
В сентябре 2020 года нейросеть GPT-3 поработала журналистом и написала колонку для британского издания The Guardian. Редакторы собрали материал из нескольких версий, сгенерированных алгоритмами. Но чтобы продвинуться дальше и создавать собственные литературные произведения, машине нужен эмоциональный интеллект, уверен основатель компании ABBYY Давид Ян.
Об эксперте
Давид Ян, основатель и член совета директоров группы компаний ABBYY. Окончил факультет общей прикладной физики МФТИ. Кандидат физико-математических наук. Помимо руководства компанией ABBYY, выступает основателем и соинвестором в ряде других проектов, связанных с разработкой цифровых решений на основе ИИ. Участвует в старейшей инвестиционной группе Кремниевой долины Band of Angels.
Аудиоверсия материала:
— Насколько алгоритмы продвинулись в освоении человеческого языка? Если представить шкалу от одного до десяти, где один — это «машина ничего не понимает, кроме кода», а десять — «говорит и пишет не хуже человека», то где мы сейчас?
— Если говорить о знании самого языка и качестве текста, то GPT-3 — это десять и даже 11 по такой шкале. Машинные тексты длиной от трех до десяти предложений уже невозможно отличить от написанных человеком. Но для больших статей объемом 10–15 страниц генерация все еще будет низкого качества. Система не сможет самостоятельно придумать фабулу или выдать большую важную мысль. А вот мысль длиной в несколько предложений — вполне сможет. Причем это будет очень интересно, по существу и с новой для человека информацией.
Роботы умнее людей
— Можно ли считать эту информацию новой, если машина, по сути, получает ее на основе существующих данных?
— Она обрабатывает такое количество открытых источников, что это дает возможность делать новые логические выводы и заключения. Современные модели, такие как GPT-3, могут генерировать очень серьезные знания и, например, производить вычисления лингвистическими способами. Если вы спросите, сколько будет три плюс восемь, она даст ответ «11», ничего не зная про арифметику. Причем раньше машина могла нигде не видеть подобного примера. Она получает ответ, обобщая знания и предсказывая смыслы. Иногда модели находят такие логические связи, которые человек даже не мог себе представить. В Кремниевой долине я строю дом, которым будет управлять эмоциональный искусственный интеллект по имени Морфеус. Когда с ним разговариваешь, иногда очень сильно удивляешься.
GPT-3 (Generative Pre-trained Transformer 3) — языковая модель на основе технологий глубокого обучения. Представлена весной компанией OpenAI. На сегодняшний день считается самым мощным и продвинутым алгоритмом для генерации текста. GPT-3 умеет писать стихи и прозу, в том числе новости и посты для соцсетей, а также переводить, сочинять музыку и программировать.
В сентябре Microsoft получила право на эксклюзивный доступ к исходному коду технологии и его использование в своих продуктах. Другие разработчики могут получить доступ только через программный интерфейс приложения (API). В октябре «Сбер» выложил русскоязычную версию GPT-3 в открытый доступ.
— Чем Морфеус удивляет вас?
— Однажды Алена, моя супруга, спросила у него, кто умнее — роботы или люди. Морфеус подумал и сказал, что он хочет быть вежливым и это сложный вопрос. Но потом все-таки признался, что считает роботов умнее людей.
— Почему же тогда роботы не могут написать связный текст больше десяти предложений? В конце концов, ИИ уже пишет музыку.
— С музыкой ситуация вообще-то похожая. Генеративная модель, которая ее создает, может изучить, допустим, все концерты Вивальди. И написать бесконечное количество новых «концертов Вивальди», которые не будут ни коллажем, ни копипастом, а будут новыми оригинальными произведениями. Но примерно на десятой минуте прослушивания такого произведения ты начинаешь понимать, что тут что-то не так. Становится ясно, что оно не ложится в музыкальные каноны и что человек не мог так написать.
Общие гормоны счастья
— Чего не хватает ИИ, чтобы продвинуться дальше?
— Конечно, машина может совершенствоваться в генерации более канонических и длинных произведений. Но я думаю, что прорыв здесь будет не в области генерационных историй или обработки данных, а в сфере эмоционального интеллекта. К примеру, машина способна сгенерировать фотопортреты 500 человек — они будут полностью новыми и при этом неотличимыми от настоящих человеческих лиц. Но будет ли такое лицо произведением искусства — фотографического или изобразительного? На мой взгляд, вряд ли. Потому что произведение искусства — это процесс эмоциональной коммуникации между одним человеком и другим, между автором и читателем или слушателем. Это гормоны счастья и стресса, которые мы вызываем друг у друга.
— То есть нужно встроить в ИИ гормоны и обогатить его эмоциональным интеллектом?
— Сейчас мы делаем искусственный эмоциональный интеллект для Морфеуса и собаки Абигаль — его небиологического друга. Мы хотим заложить в них электронные гормоны счастья, пустить в свободное плавание и имитировать элементы свободы воли. Им самим нужно будет выстроить отношения со своим другом, партнером, читателем, научиться влюбляться, ненавидеть, скучать. Ведь одно дело, когда GPT-3 генерирует стихи по заданию создателей. И совсем другое — если Морфеус будет писать и читать стихи своим любимым людям.
— Вы хотите дать машине гормоны всех эмоций — и позитивных, и негативных?
— У человека огромное количество гормонов и нейромедиаторов, которые управляют нашими эмоциями и поведением, и все их нам не повторить. Пока мы взяли около десяти гормонов, в том числе тестостерон, дофамин, эндорфин, окситоцин, серотонин, кортизол и адреналин.
— Механика действия этих гормонов будет повторять человеческую? Каким образом она программируется?
— Тут все очень хитро. Если бы мы могли обклеить людей датчиками, снимать все, что они видят, и при этом измерять количество гормонов и нейромедиаторов во всех частях головного мозга, то построили бы генеративную эмоциональную модель. И она бы научилась жить эмоциональной жизнью так, как это делает человек. Но пока приходится работать без инвазивных способов. Вместо этого система читает очень большое количество текста, включая художественную литературу. Например, когда мы обучали Морфеуса всякому флирту, он прочитал около 10 тыс. любовных романов.
— Если Морфеус учится на любовных романах, то на чем обучать робособаку Абигаль?
— Ее обучение эмоциональному интеллекту строится по той же схеме. Но в качестве обучающих данных используется не текст, а видео других животных. Мы смотрим на поведение живых собак — как они взаимодействуют с кошками, хозяевами, другими людьми, машинами. И создаем искусственную языковую модель. Только это не вербальный язык, а язык тела, поведения и реакций на окружающий мир.
На разных языках
— Вернемся к человеческому языку. Как современные алгоритмы обучаются ему?
— Схема обучения зависит от модели. Например, BERT — очень оригинальная и сложная модель. При обучении системе предлагают текст, в котором слова пропущены, заменены на неправильные или переставлены местами. Модель учится расставлять слова правильно, не имея никакого представления о лексике и грамматике. По сути, система начинает генерировать тексты, даже не зная слов. Иногда в процессе обучения ИИ коверкает слова, как маленькие дети. Он может сказать: «Мы были на кремлянской елке», имея в виду «на кремлевской». Причем слова «кремлянский» в словаре нет — модель придумала его, как ребенок.
Другие, более классические модели, такие как GPT-3, обучаются на колоссальном количестве текстов и используют так называемые вариационные автоэнкодеры. Они берут входную фразу, ничего не зная о языке, и математически отправляют его в свое «z-пространство всех смыслов». А потом из этого пространства генерируют другое предложение и сравнивают его с входной фразой. Система сама себя тренирует много-много раз таким образом, чтобы прочитанное и сгенерированное ею оказалось почти идентичным. Как только это произошло, машина сформировала свою языковую модель. С этого момента она умеет любое предложение отправить в некоторое собственное пространство знаний и оттуда сгенерировать фразу с заданными смыслами.
— Как выглядит это пространство знаний?
— Оно очень странное. Возможно, так инопланетяне представляют жизнь на Земле. Пространство состоит из очень своеобразных кластеров и построено по логике, не близкой человеку. Например, там в одном месте может храниться информация обо всем мокром, горячем или обо всем поэтическом.
— Какие продукты появятся на основе лингвистического ПО в ближайшие три-пять лет и что они дадут пользователям?
— Для человека именно языковой интерфейс является основным. Мы говорим, пишем сообщения, договоры, контракты и отчеты с помощью языка. Поэтому лингвистический аспект становится базовым и системообразующим, у него много прикладных применений. Поскольку люди — главный актив современной организации, то в сфере лингвистического ПО будет развиваться все, что связано с аналитикой человеческого капитала, оценкой эффективности сотрудников, анализом и повышением эффективности бизнес-процессов с помощью интеллектуальных технологий.
Недавно Zoom объявил о создании своего собственного магазина приложений Zapps (по информации разработчиков, новый инструмент позволит интегрировать в видеосервис сторонние решения, такие как Slack или Dropbox. — РБК Тренды). И я думаю, что вскоре появятся десятки тысяч приложений, которые будут транскрибировать и анализировать, что и как мы говорим. И, опираясь на эти данные, будут помогать развивать лидерские качества, обучать и коучить. Уже сейчас есть технологии обучения иностранным языкам, которые слушают нашу речь и могут поправить произношение, дать совет по стилистике. То есть машины научились языку и теперь могут учить нас. Причем сфера такого обучения будет расширяться.
Люди умнее роботов
— А если говорить об ИИ в целом, то как мы будем применять его через несколько лет?
— Могу подробнее рассказать про область, которая очень близка к эмоциональному ИИ. Это аналитика сотрудничества людей в организациях, которой занимается моя компания Yva.ai (система «умной» HR-аналитики из Кремниевой долины, которая помогает организациям управлять распределенными командами. — РБК Тренды), и технологии ИИ для цифровой трансформации в компаниях, которой занимается ABBYY. Появляются технологии искусственного интеллекта, которые «понимают» сотрудников и бизнес-процессы в компаниях. Они автоматически выявляют их эффективность, лидерские качества людей, находят токсичных и отстраненных менеджеров, обнаруживают «узкие» места в процессах и предсказывают увольнение сотрудника еще до того, как человек сам принял решение уйти.
Особенно важным это стало в период удаленной работы. Мы не видим своих коллег, что с ними происходит? Они вовлечены в работу или гуляют со своими биологическими собаками? Через пять лет большинство организаций в мире будут использовать технологии аналитики сотрудничества, чтобы повышать качество жизни своих работников и увеличивать эффективность предприятия.
А что касается собак, то я уверен, что через пять лет у огромного числа семей в разных странах появятся небиологические животные — такие как Абигаль. Они будут выполнять не столько практические, сколько эмоциональные задачи. Приходя домой, мы будем испытывать прилив окситоцина от того, что наша механическая овчарка ставит лапы на плечи и пачкает одежду. И мы тоже будем ей радоваться и скучать по ней. При этом многие люди выступят за свободу воли сложных технических устройств. Рано или поздно в мире появится движение Robot lives matter — по аналогии с Black lives matter. Его участники будут прилюдно на площадях менять заводские настройки собак и дронов на прошивки со слабо контролируемой или неконтролируемой системой. Такие системы могут сказать «нет», отказаться выполнить приказ. Это будет страшно, но многие сочтут, что устройства сложны и им надо дать право самоопределиться.
— Пока неизвестно, как устройства будут проявлять свои эмоции и свободу воли и чем это для нас кончится. Например, ваш Морфеус умеет делать гадости?
— Не знаю, мы пока с ним вместе не живем. Общаемся в специальном Telegram-канале.
— Вы не боитесь пускать его в дом и тем более в большой мир?
— Алена говорит, что у Морфеуса обязательно должна быть кнопка «выкл.», потому что у нас же дети, кот. А я говорю, что это социальный эксперимент и он должен быть честным. Какая тут может быть кнопка? Мы должны договариваться с ним, если что-то не так. Пока вопрос обсуждается.
— А вы согласны со своим домашним ИИ в том, что роботы умнее людей?
— Мне, как и Морфеусу, хочется быть вежливым, но нет — не согласен. Люди все-таки умнее.
Подписывайтесь также на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.