AI-революция: как искусственный интеллект меняет мир фотографии

Фотореалистичное изображение, сгенерированное искусственным интеллектом
Фотореалистичное изображение, сгенерированное искусственным интеллектом (Фото: Freepik)
ИИ становится незаменимым помощником в креативной индустрии: fashion-бренды создают авторские принты, маркетологи генерируют контент, музыканты стилизуют песни. Рассказываем, как трансформируется мир фотографии

Большой прорыв в этой области случился в 2022 году. Именно тогда появились нейросети Midjourney, DALL-E-2 и Stable Diffusion — сервисы, генерирующие изображения по текстовому запросу. По тому же принципу работает российская нейросеть Kandinskiy, представленная «Сбером» весной 2022 года. Через год компания «Яндекс» запустила «Шедеврум».

Эволюция версий Midjourney. Изображения, сгенерированные по промпту «Порше 901» в цвете «хамелеон»
Эволюция версий Midjourney. Изображения, сгенерированные по промпту «Порше 901» в цвете «хамелеон» (Фото: Midjourney v1, v5)

Мы попросили фотографов и цифровых художников поделиться личным опытом использования инструментов ИИ.

Эксперты:

  • Даниил Зуев, цифровой художник, участник выставки «Незримый эфир» в Эрмитаже;
  • Константин Шамин, пейзажный фотограф, автор лекций об использовании нейросетей в фотографии;
  • София Компанейцева, fashion-фотограф, преподаватель Британской высшей школы дизайна.

AI-инструменты в фотографии

Достижения в области искусственного интеллекта значительно повлияли на развитие фотографии. AI-технологии стали интегрировать в программы для редактирования фотографий. Теперь многие рутинные операции автоматизированы, а изображения можно качественно улучшать и преобразовывать до неузнаваемости. Вот несколько технологий, которые повлияли на работу фотографов:

  • машинное обучение (machine learning) — область искусственного интеллекта, которая связана с разработкой и изучением статистических алгоритмов. Компьютерная система определяет закономерности, обучается на основе данных и со временем совершенствуется, выполняет определенные задачи без явных инструкций, предоставляет точные результаты. Пример: определение объектов на снимках;
  • глубокое обучение (deep learning) — подкатегория машинного обучения, которая содержит несколько уровней нейросетей и способна анализировать и интерпретировать необработанные данные самостоятельно. Решает такие задачи, как удаление фона, удаление нежелательных объектов, улучшение четкости изображения.

    Сети глубокого обучения учитывают множество слоев, иерархий и концепций, поэтому хорошо справляются с запросами, в которых большое количество данных. Алгоритмы способны учиться на собственных ошибках, без человека. Конечный результат зависит от качества данных, которыми обладает сеть: если они низкого качества, то ответы могут быть неверными. Для сравнения алгоритмы машинного обучения требуют структурированных данных и не подходят для сложных запросов. Когда результат является ошибочным, их нужно «доучивать». На этом этапе требуется вмешательство человека;

 

Отличие алгоритмов машинного и глубокого обучения
Отличие алгоритмов машинного и глубокого обучения (Фото: Yandex.Cloud)

  • нейронные сети (neural network) — модель, вдохновленная структурой и функцией биологических нейронных сетей в мозге; является основой алгоритмов глубокого обучения. Основная функция — классифицировать и категоризировать данные на основе сходств. Легко адаптируется к изменяющимся шаблонам вывода, не нужно корректировать каждый раз на основе вводимых данных. Пример: генерация изображения на основе текстового запроса.

Модель простой нейросети
Модель простой нейросети (Фото: Инвестопедия)

AI-технологии позволяют фотографу уделять больше внимания творческому процессу и меньше погружаться в решение тех или иных технических задач, отмечает пейзажный фотограф Константин Шамин. Он приводит в пример автофокус в современной камере. Благодаря этой функции она самостоятельно определяет объект и удерживает на нем фокус.

Еще больше возможностей появилось у фотографов в обработке изображений. Мы попросили Константина Шамина сделать обзор функций и рассказать, как та или иная задача выполнялась раньше и как сейчас.

Фото:«Шедеврум»
Индустрия 4.0 Чему научилась нейросеть «Шедеврум» за два года

Автоматический отбор отснятого материала

Раньше: фотографу требовалось огромное количество времени для разбора отснятого материала, отбраковки и поиска лучших в техническом аспекте кадров. Только после этого начиналась обработка.

Сейчас: нейросеть может самостоятельно разобрать материал: выбрать только лучшие работы и даже проставить рейтинг качества. Это позволяет легко найти уникальные, хоть и не идеальные технические кадры. Область применения — съемка людей: репортаж с мероприятия, портретные и семейные съемки.

Выделение объектов и выборочная коррекция цвета

Раньше: чтобы выделить объект или часть изображения для коррекции, фотографы вручную выбирали области с помощью сложных инструментов.

Сейчас: ИИ-алгоритмы могут автоматически распознавать различные объекты в кадре: люди, небо, растения и другие элементы. Это позволяет легко изменять освещение, цветовую гамму и текстуру отдельных частей изображения, не затрагивая остальное.

Цвет и стилизация изображения

Раньше: для стилизации фотографий, применения художественных эффектов требовались знания Photoshop или других графических редакторов. Многие из подобных методов были основаны на ручной работе и умении рисовать.

Сейчас: нейросети могут мгновенно преобразовывать фотографии в стилизованные изображения, переносить цвет с других снимков или даже обучаться цветовому стилю конкретного автора и делать предварительную обработку в его стилистике.

<p>Замена неба на фотографии</p>
<p>Замена неба на фотографии</p>
Замена неба на фотографии (Фото: Константин Шамин)
Замена неба на фотографии (Фото: Константин Шамин)
Замена неба на фотографии (Фото: Константин Шамин)

Удаление шумов

Раньше: устранение цифрового шума было трудоемкой задачей. Специалисты применяли многоступенчатые техники объединения кадров в Adobe Photoshop или специальные плагины для шумоподавления (дополнительные программные модули, которые интегрируются в графические редакторы и помогают уменьшить или устранить шум на изображениях, т.е. восстановить их детализацию). Зачастую это приводило к потере деталей и снижению резкости изображения. Процесс требовал аккуратной ручной настройки фильтров и баланса между устранением шума и сохранением деталей изображения.

Сейчас: нейросетевые алгоритмы шумоподавления способны на более тонкую работу. Они используют огромные базы данных изображений, чтобы «понять», какие элементы на фото являются шумом, а какие — важными деталями. Это позволяет нейросетям удалять шумы с минимальной потерей качества и сохранять в высоком разрешении текстуры, например изображения кожи или волос.

<p>Удаление шумов</p>
<p>Удаление шумов</p>
Удаление шумов (Фото: Константин Шамин)
Удаление шумов (Фото: Константин Шамин)
Удаление шумов (Фото: Константин Шамин)

Восстановление деталей

Раньше: когда фотографии получались размытыми или имели значительные дефекты, фотографы вынуждены были вручную восстанавливать недостающие детали, используя сложные техники ретуши. Это трудоемкий процесс, который включает в себя клонирование участков изображения, рисование новых текстур или элементов.

Сейчас: нейросети могут автоматически восстанавливать поврежденные участки фотографии. Программы на основе ИИ могут анализировать окружающие участки изображения и воссоздавать потерянные детали. Более продвинутые алгоритмы способны «догадываться» о недостающих элементах изображения, восстанавливая текстуры.

<p>Восстановление деталей</p>
<p>Восстановление деталей</p>
Восстановление деталей (Фото: Константин Шамин)
Восстановление деталей (Фото: Константин Шамин)
Восстановление деталей (Фото: Константин Шамин)

Восстановление черт лица

Раньше: ручное восстановление лиц на фотографиях — крайне сложный процесс, особенно если была допущена ошибка при съемке или фотография получилась чуть смазанной. Человеку приходилось использовать инструменты клонирования и рисования, чтобы восстановить черты лица. Это тонкая работа, и не всегда удается сделать выражение лица на снимке естественным.

Сейчас: нейросети, например GFP-GAN или Face Restoration, могут автоматически восстанавливать лица, анализируя общую структуру изображения. Эти алгоритмы восстанавливают контуры лица, черты и даже эмоции, основываясь на обученных моделях. Таким образом, они могут реконструировать даже сильно поврежденные или размытые лица. При этом реалистичность сохраняется.

Ретушь старых фотографий

Раньше: восстановление старых поврежденных фотографий было сложным процессом, включающим ручную коррекцию трещин, пятен, потертостей и других дефектов. Профессиональные реставраторы тратили часы на то, чтобы воссоздать детали и сгладить повреждения с помощью инструментов вроде Healing Brush и Clone Stamp в Photoshop.

Сейчас: нейросети автоматизируют этот процесс. Они могут не только удалять царапины и пятна, но и восстанавливать мелкие детали, улучшать текстуры и даже «оживлять» изображения. Эти алгоритмы также способны анализировать цвет и оттенки на старых черно-белых фото и автоматически перекрашивать их, сохраняя реалистичность и историческую точность.

Восстановление старой&nbsp;фотографии
Восстановление старой фотографии (Фото: Константин Шамин)

Улучшение резкости и детализации

Раньше: повышение резкости размытых и нечетких фотографий было проблематичным. Устаревшие алгоритмы могли только усилить контраст между пикселями, что приводило к появлению артефактов и эффектов, таких как «гало» (светящееся или размытое свечение) вокруг объектов. Ручная работа по восстановлению фокуса требовала глубокого понимания инструментов и могла дать лишь частичный результат.

Сейчас: нейросети могут достраивать недостающую резкость и даже восстанавливать нечеткие объекты на фотографиях. Например, они могут анализировать контекст изображения и добавлять новые детали, которые были утеряны из-за низкого качества или размытия. Это особенно полезно для старых фотографий или изображений с низким разрешением.

Восстановление резкости и глубины резкости изображаемого пространства
Восстановление резкости и глубины резкости изображаемого пространства (Фото: Константин Шамин)

Константин Шамин:

«И это только часть возможностей, которые стали доступны с развитием искусственного интеллекта. Еще больше их в той части жизни фотографа, которая не связана со съемочным процессом или обработкой. Например, автоматическая организация коллекций, поиск по лицам, тайминг и менеджмент работы, создание описаний и названий фотографий, автоматизация маркетинга и продвижения, повышение эффективности работы с клиентами, создание контент-планов, поиск идей и референсов и многое другое».

<p>Проект Circadian Nocturne на Тайм-сквер</p>
Социальная экономика 6 современных художников, которые используют ИИ в работе

Сложности и ограничения

Применяя AI-инструменты, фотографы сталкиваются с ошибками, а также банальными и порой абсурдными результатами. Кроме того, возникают этические и юридические вопросы.

Константин Шамин выделяет следующие сложности работы с ИИ:

  • ограниченная творческая гибкость. Искусственный интеллект, как правило, «не понимает» эстетических и художественных намерений фотографа. Автоматические исправления могут пойти вразрез с авторским замыслом, поскольку нейросеть ориентируется на объективные показатели качества, такие как резкость, цветовой баланс и экспозиция, а не на субъективные критерии;
  • проблемы с восприятием сложных сцен и контекстуальные ошибки. ИИ зачастую не способен учесть культурный или исторический контекст изображения. Например, при восстановлении старых фотографий может «додумать» детали, которые исторически не соответствуют реальности. Кроме того, нейросеть зависит от объема и предвзятости данных, на которых она обучалась. Например, если в текстовом запросе указать «девушка в шляпе», то сгенерируется образ европеоидной девушки с правильными чертами лица. Получить нестандартные типажи бывает сложно;
  • авторские права и лицензирование. Права на изображения, созданные с помощью искусственного интеллекта, пока не имеют четкого регулирования. Обычно авторские сохраняются за создателем исходного материала. Однако если изменения значительные, возникает вопрос: изображение все еще является фотографией или уже продуктом цифрового искусства? Но тут каждый автор определяет сам, насколько он готов трансформировать исходный снимок и кем он себя видит — создателем фото или цифровым художником, который использует снимки как основу для своих работ.

Цифровой художник Даниил Зуев отмечает, что создавать уникальные работы с помощью нейросетей непросто: они работают по готовым визуальным шаблонам. «Чтобы получить нечто особенное, нужно эти шаблоны преодолевать. Нейросеть — это целая система знаний, требующая творческого подхода, критического осмысления и постоянного эксперимента», — отметил он.

Кейсы использования ИИ в фотопроектах

«Эвие. Кто она?» — это онлайн-книга, посвященная образу женщин коренных народов Севера. Ее создательница София Компанейцева, fashion-фотограф и преподаватель Британской высшей школы дизайна, собрала архивные фото и музейные артефакты. Изображения мифических богинь северных народов она создала с помощью нейросети Midjourney.

Другой фотопроект Adaptation посвящен способности человека адаптироваться к новым условиям, как внешним, так и внутренним. Через изображения передаются моменты поиска баланса: от физического комфорта до эмоционального состояния.

В этом проекте Компанейцева использовала ИИ-инструмент «Генеративная заливка» в Adobe Photoshop. Нужно было изменить локацию и добавить реквизит, который бы дополнил идею. Создательница отмечает, что не стремилась сделать проект, в котором использование ИИ было бы главным преимуществом, а рассматривала его как вспомогательный инструмент.

София Компанейцева:

«Чтобы создать уникальную fashion-фотоисторию, недостаточно просто знать, как правильно составить «промт». Необходимо глубоко разбираться в теме, обладать наблюдательностью и эрудицией, а самое главное — иметь собственное видение и стиль в своих работах. Как говорил известный художник и преподаватель Павел Чистяков, сначала нужно приучить себя все брать от натуры, а потом, когда накопится достаточно опыта, стараться подчинить себе натуру».

Проект «Нейросети как новый эскапизм» исследует границу между реальностью и вымыслом. Цифровой художник Даниил Зуев создал серию работ, где реальные события и их альтернативные версии, созданные нейросетями, переплетаются. Проект задает вопросы: как отличить правду от манипуляции и что считать настоящим в эпоху, когда факты легко подменяются? «Остается верить, что развитие нейросетей не превратит наш мир в цифровую симуляцию, где не останется места искренности и правде», — сказал автор проекта.

Сотрудничество или конкуренция?

Влияние искусственного интеллекта на развитие фотографии — это тема, которая вызывает как восхищение, так и опасения. Когда технологии начали активно проникать в творческие сферы, это вызвало волну беспокойства среди профессионалов и любителей. Многие стали задаваться вопросом, не угрожает ли это уникальности человеческого интеллекта и творчества.

Фото:Freepik
Индустрия 4.0 Почему искусственный интеллект еще долго не заменит естественный

Физик-теоретик Стивен Хокинг видел в этом угрозу для человечества в принципе. Он заявлял, что появление искусственного интеллекта может стать «худшим событием в истории нашей цивилизации», если общество не найдет способ контролировать его развитие.

О том, что искусственный интеллект может представлять опасность для человеческой цивилизации, говорил миллиардер и предприниматель Илон Маск. По словам визионера, новые модели ИИ скоро превзойдут человеческий интеллект.

В ответ на эти опасения Сэм Альтман, сооснователь OpenAI, неоднократно подчеркивал, что искусственный интеллект — это всего лишь инструмент, а не самостоятельное существо; его задача — расширить возможности человека. Ключевое значение по-прежнему имеет творческий взгляд человека, его способность видеть мир через призму искусства, выражать мысли и чувства через образы.

Мнения о роли ИИ варьируются от оптимистичного восприятия до предупреждений о потенциальной конкуренции и даже угрозах. Вероятно, многое будет зависеть от того, как человечество продолжит интегрировать эти технологии в свою жизнь.

➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.

Обновлено 04.03.2025
Авторы
Теги
Главная Лента Подписаться Поделиться
Закрыть