Как изменилось творчество нейросетей с первых версий к концу 2023 года

Фото: Dalle-3

В 2023-м нейросети, генерирующие изображения, стали лучше понимать запросы, корректнее «рисовать» человеческое тело и в целом создавать более детализированные картинки. Показываем, как изменились изображения к концу года

DALL-E

DALL-E — генеративная нейросеть от компании OpenAI (создателя ChatGPT). Первую версию DALL-E представили в 2021 году, в 2022 году — вторую, а в 2023-м — третью. Последняя достаточно точно понимает и выполняет запросы пользователей и генерирует качественные во всех смыслах изображения.

Плюшевые мишки, работающие над новыми исследованиями ИИ на Луне в 1980-х

Женщина, сидящая на природе, в стиле Моны Лизы

Молодая красивая девушка в желтом кимоно с совой и перьями в волосах стоит в тропической теплице. Снято на зеркальную камеру

Альберт Эйнштейн в Зверополисе (2016)

Индустрия 4.0 Нейросеть DALL-E и ее возможности: от цифрового фото до полотна Босха

Midjourney

Midjourney — одна из самых продвинутых нейросетей, генерирующих изображения. Ее разработала независимая исследовательская лаборатория Midjourney из Сан-Франциско. Первая версия стала доступна в феврале 2022 года. Тогда она генерировала изображения, которые далеко не всегда были похожи на то, что хотел пользователь, а многие объекты, в частности человеческие руки, выглядели, мягко говоря, странно. Однако с каждой новой версией нейросеть генерировала все более точные и реалистичные изображения. В декабре 2023 года разработчики выпустили шестую версию Midjourney, чьи сгенерированные картинки стало еще сложнее отличить от реальных фотографий и рисунков.

Лес рук

Портретное фото мальчика в костюме принца

Город будущего

Карандашный рисунок со львом, солнцем и пальмой на белом листе бумаги, сделанный трехлетним ребенком

Экономика инноваций От каракулей до фотореализма: что умеет Midjourney спустя 8 месяцев

Kandinsky

Нейросеть Kandinsky — это разработка «Сбера», которая генерирует изображения в разных стилях. Первая версия Kandinsky 2.0 была представлена в июне 2022 года. В 2023 году выпустили три новые версии — Kandinsky 2.1, Kandinsky 2.2 и Kandinsky 3.0. За год нейросеть научилась создавать фотореалистичные изображения в разных форматах, появилось еще больше стилей, запросы стали пониматься точнее, а также появилась функция генерации видео.

A teddy bear на Красной площади

РБК рассказывает бизнесу о новой экономике

Девушка в красном платье

Железный человек on the Moon

<p>Изображение сгенерировано по запросу «Ежик в тумане»</p>

Индустрия 4.0 Kandinsky Video и Kandinsky 3.0: что умеют новые нейросети

«Шедеврум»

«Шедеврум» — нейросеть, разработанная «Яндексом» и выпущенная в апреле 2023 года. В отличие от аналогов она доступна только в одноименном мобильном приложении, которое работает как социальная сеть: пользователи могут подписываться друг на друга и смотреть сгенерированные изображения в общей ленте и в личных профилях. За год разработчики несколько раз обновляли нейросеть, в том числе встроили в нее большую языковую модель YandexGPT для лучшего понимания запросов пользователей, и нейросеть YandexART, которая создает более реалистичные и детализированные изображения. Кстати, «Шедеврум» генерирует не только изображения, но и текст. А активным пользователям доступна функция создания видео.