Об авторе: Владимир Арлазаров, генеральный директор Smart Engines, ведущий научный сотрудник ФИЦ ИУ РАН, доктор технических наук.
Кажется, что сейчас мы переживаем «золотой век» искусственного интеллекта. Компании инвестируют десятки миллиардов долларов в разработку инструментов на базе генеративного ИИ. Журналисты и исследователи экспериментируют с ChatGPT, прося его то сочинить стих, то написать статью. Правительства многих стран обсуждают или уже принимают законы, регулирующие использование алгоритмов. Однако в истории уже были похожие периоды эйфории по поводу искусственного интеллекта. И заканчивались они разочарованием, оттоком инвестиций и замедлением развития технологий. Рассказываем, почему происходили эти спады и стоит ли ожидать схожий итог у нынешней ИИ-лихорадки.
Как появился термин
«Зима искусственного интеллекта» — период, когда происходит снижение финансирования и интереса к исследованиям в области ИИ. Термин впервые появился в 1984 году как тема публичной дискуссии на ежегодной встрече Американской ассоциации искусственного интеллекта (AAAI). На ней ведущие исследователи в области ИИ Роджер Шэнк и Марвин Мински высказали опасения насчет того, что энтузиазм вокруг ИИ выходит из-под контроля, и в перспективе ни к чему хорошему не приведет. Они сравнили этот процесс с ядерной зимой — в том смысле, что будет запущена цепная реакция, когда ученые из-за неоправдавшихся ожиданий разочаруются в эффективности технологий, подобные пессимистические настроения начнут тиражировать СМИ, а инвесторы не захотят вкладываться в разработки с туманными перспективами. И в конце концов исследования окажутся полностью или почти полностью прекращены. Неизвестно, как участники встречи отреагировали на предостережения коллег, но уже через три года их прогноз сбылся. Впрочем, вернемся немного назад.
Первая и вторая зимы искусственного интеллекта
Первая зима ИИ продлилась с 1974 по 1980 год. До этого ей предшествовали практически два десятилетия активно нарастающего интереса к «мыслящим машинам» со стороны ученых и широкой общественности.
В 1956 году в Дартмутском колледже прошел двухмесячный семинар, на котором для обозначения новой области исследования, занимающейся моделированием человеческого разума, американский информатик Джон Маккарти предложил термин «искусственный интеллект». А за два года до этого в Джорджтауне в штаб-квартире корпорации IBM был продемонстрирован полностью автоматический перевод более 60 предложений с русского языка на английский. Презентация прошла успешно и, будучи широко разрекламированной в СМИ, побудила правительство США начать больше инвестировать в компьютерную лингвистику. И не только в нее — с 1950-х по 1970-е годы Управление перспективных исследовательских проектов Министерства обороны США (DARPA) финансировало исследования в области искусственного интеллекта с минимальными требованиями к разработке проектов — фактически исследователи ИИ могли тратить полученные средства на любые проекты, которые им придут в голову. В этот период также появился предшественние современных нейросетей — перцептрон.
Но к 1970-м всеобщий энтузиазм начал затухать. Во-первых, алгоритмы-предшественники онлайн-переводчика DeepL хоть и подавали большие надежды, но без понимания контекста предложения выдавали некорректные результаты и в целом обходились дороже людей-переводчиков. Во-вторых, в 1969 году вышла книга «Перцептроны» Марвина Мински и Сеймура Пейперти, в которой ученые заявили, что хоть первые нейросетевые модели и показывали феноменальные способности к обучению, их функциональность для решения каких-либо задач на тот момент была крайне мала. В-третьих, повлияло и принятие поправки сенатора Майкла Мэнсфилда 1969 года. В соответствии с инициативой, DARPA сокращала финансирование «общих исследований». Теперь ученые были обязаны доказать, что их ИИ-исследования имеют «прямую и очевидную» пользу для конкретных военных задач. Финальным аккордом стал отчет английского ученого Джеймса Лайтхилла, подготовленный в 1973 году. В нем английский математик дал крайне пессимистический прогноз насчет перспектив ИИ, отдельно отметив, что ни одно из открытий в этой области не оказало существенного влияния на науку и общество в целом.
В результате накопившегося разочарования поток инвестиций иссяк, интерес правительств и широкой общественности к технологиям ИИ практически сошел на нет, что привело к остановке многих исследований и разработок.
В 1980-х интерес к ИИ возродили экспертные системы — программы для ЭВМ, которые умели предсказывать и прогнозировать результаты какого-либо события со множеством переменных на основе полученных данных. Корпорации по всему миру начали активно их внедрять, а Министерство международной торговли и промышленности Японии даже запустило проект по созданию компьютерных систем пятого поколения, которые, как предполагалось, смогут вести беседу с людьми, интерпретировать изображения и станут основой для будущих исследований ИИ. Но затем все повторилось, как в 1970-е. Экспертные системы и вычислительные машины, на которых те запускались, было дорого обслуживать, и по итогу они проиграли конкурентную борьбу компьютерам Apple и IBM. Проект японского министерства тоже провалился, и это тоже внесло вклад в начало второй «зима искусственного интеллекта», которая продлилась с 1987 по 1994 год.
Статистические методы машинного обучения, основанные на увеличении объема данных и вычислительных ресурсов, вновь возродили интерес к ИИ, однако на протяжении ряда лет к ним сохранялось скептическое отношение. Как писал один из авторов The Economist в 2007 году о разработках в сфере распознавания речи: «Технология произвела на них [венчурных капиталистов] впечатление, но их отпугнул термин «распознавание голоса», который, как и «искусственный интеллект», ассоциируется с системами, слишком часто не выполняющими своих обещаний».
Что происходит сейчас
Можно с уверенностью сказать, что сейчас мы находимся в самом разгаре лета ИИ. Началом его можно назвать 2012 год, когда группа ученых из Университета Торонто представила архитектуру AlexNet. Это был настоящий прорыв — авторы впервые использовали сверточные нейросети с общей глубиной в восемь слоев и показали, что такая нейросеть может достичь значительно более высоких результатов по сравнению с традиционными моделями машинного обучения. За ней последовали другие архитектуры нейросетей, например Transformer, большие языковые модели, ChatGPT и тому подобное. Однако некоторые эксперты опасаются, что скоро наступит новая зима.
Повышение производительности труда с помощью ИИ
Прежде всего за всеми этими разговорами про «всемогущий» ИИ теряется главное — повышение производительности труда. Возьмем роботакси и автопилоты. Сколько лет нам обещают, что они буквально завтра станут повсеместным явлением и помогут сократить число аварий, однако пока этого не наблюдается. Та же Tesla с системой автопилота за девять месяцев 2022 года оказалась замешана в 273 авариях. Да и вообще — зачем пытаться кого-то заменить машиной? Если вместо человека автомобилем будет управлять робот, от этого что-то сильно изменится? С точки зрения повышения эффективности труда лучше менять не водителя, а транспортное средство — водитель автобуса работает многократно эффективнее, чем водитель персональной машины.
Не обойдем вниманием и ChatGPT. Это великолепный человеко-машинный интерфейс, но, во-первых, все его результаты надо перепроверять. Во-вторых, до сих не совсем понятна конечная цель его применения. Чат-бот умеет коммуницировать, как человек, но что это дает экономике: если такую технологию, например, поставить общаться с клиентом, то это лишь приведет к снижению качества сервиса. И в этом основная беда — в ИИ активно инвестируют, но ни у кого нет четкого и реалистичного представления, что должно в итоге получиться. Только обещания, что искусственный интеллект будет лучше человека ставить диагнозы, водить машину и так далее.
Конечно, мы не хотим сказать, что технологии ИИ бесполезны: во многих отраслях правильное их применение (не замена человеку, а помощь ему) дает положительный эффект. Однако инвестиции в них пока несоразмерны эффекту. Согласно статистике, 60–80% проектов, связанных с искусственным интеллектом, проваливаются, а потому сейчас можно прогнозировать, что многие финансовые вложения в эту область окажутся потрачены в никуда. А это чревато тем, что всеобщее ликование по поводу ИИ вскоре сменится, и, похоже, уже на наших глазах сменяется, всеобщим разочарованием и приостановкой инвестиций с заморозкой многих проектов.
Законодательное регулирование ИИ
Не меньшего внимания заслуживает тот факт, что ChatGPT и ему подобные модели обучаются на данных, которые, вообще-то говоря, кому-то принадлежат. И все больше людей начинают высказывать недовольство, что их данными без разрешения пользуются посторонние лица. Так, в конце 2023 года The New York Times подало в суд на OpenAI и Microsoft. Издание обвинило IT-компании в том, что те незаконно используют «уникально ценные произведения NYT».
Законодательное регулирование ИИ тоже может привести к новой зиме. В марте 2024 года Европейский парламент одобрил закон, регулирующий использование искусственного интеллекта (в частности, для технологий ИИ вводятся категории риска — от низкой до неприемлемой, а также попадают под запрет системы распознавания лиц в режиме реального времени и социальный рейтинг). «Яндекс» первым на российском рынке начал маркировать рекламу, сгенерированную с помощью искусственного интеллекта. Следует ожидать, что подобных законов и ограничений в будущем станет только больше.
Причины этого процесса понятны. Государство должно следовать воле своих избирателей, а те, во-первых, желают знать, какой контент был создан человеком, а какой — машиной. Во-вторых, они не хотят, чтобы ИИ учился на их данных. Едва ли кому-нибудь понравится, что после посещения условного сайта с квартирами на продажу ему вскоре начинают звонить и предлагать выгодные ипотеки, кредиты и тому подобное.
Экономика и экология
Отдельно стоит рассмотреть вопрос энергопотребления и экологический вред от технологий ИИ. ChatGPT потребляет не просто огромное, а чудовищно огромное количество энергии — чат-бот OpenAI отвечает на 200 млн запросов ежедневно, и серверам, на которых работает сервис, для этого необходимо 500 тыс. кВт·ч энергии (для сравнения — в год среднестатистическое домохозяйство в США использует лишь 29 кВт·ч). И это не предел — по оценкам одного из крупнейших в мире инвестиционных банков Goldman Sachs, искусственный интеллект способен увеличить потребность в электроэнергии в центрах обработки данных на 160% к 2030 году.
Экономические издержки, вызванные чрезмерным потреблением ИИ электроэнергии, могут в какой-то момент перевесить выгоды от использования технологии, и это приведет к уменьшению числа дата-центров. А помимо чисто экономических соображений, существуют еще и экологический фактор. Например, в 2023 году у Google был зафиксирован 13% рост выбросов парниковых газов, вызванный интеграцией ИИ в продукты компании и нехваткой возобновляемых источников энергии в Азии и некоторых регионах США. Сейчас эксперты высказывают серьезные опасения насчет того, что искусственный интеллект способствует приближению климатического кризиса, и это тоже может привести к приостановке в скором будущем многих ИИ-проектов.
Когда снова наступит зима искусственного интеллекта
Чтобы предотвратить новую зиму, необходимо сосредотачиваться на тех технологиях и тех проектах, которые принесут очевидную пользу с точки зрения производительности труда и экономики. Ресурсы человечества не бесконечны, а это значит, что их нужно использовать максимально эффективно. Касаемо «наших» нейросетей, таких как Kandinsky или GigaChat — конечно, хорошо, что мы смогли повторить успехи Америки. Но, откровенно говоря, это не лучшие достижения Соединенных Штатов. Если бы мы сделали нейросеть, которая умеет предсказывать новые материалы и лекарства, и внедрили ее в промышленность, то это дало бы ощутимую пользу и экономике, и людям. Или всерьез занялись компьютерной томографией и новыми методами, позволяющими осуществлять исследование объектов без их разрушения. Это способствовало бы прорыву в производстве авиадвигателей или иных сложных аппаратов.
Все перечисленное дало бы понятный экономический эффект, который ChatGPT или Kandinsky пока продемонстрировать не могут. Но, к сожалению, это понимают в основном специалисты, а тем временем широкая публика очарована тем, что новая разработка OpenAI Sora умеет на основе текстового запроса генерировать видео в высоком качестве. Но когда-нибудь, а, скорее всего, в ближайшие годы, люди пресытятся новостями о нейросетях или появится новый инфоповод, например, Илон Маск колонизирует Марс, и этот пузырь языковых моделей лопнет, как в свое время было с доткомами. Начнется очередная «зима ИИ».