Нейросеть рисует: 10 нейросетей для генерации изображения по описанию

Разбираемся, как создать изображение с помощью нейросети (Фото: Dalle-3)

Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые нейросети бесплатны и доступны всем желающим

Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. «РБК Тренды» подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).

Индустрия 4.0 Что такое нейросеть: как устроен человеческий мозг «в цифре»

Содержание:

DALL-E
DALL-E Mini
Kandinsky
Firefly
Craiyon
Easy-Peasy.AI
Midjourney
«Шедеврум»
Starryai
Dream by WOMBO

1. DALL-E

Как попробовать:

в платной подписке ChatGPT Plus (в России без VPN не доступен) за $20 в месяц;
через бесплатный сайт Dall-E 3 или бот в Telegram Dalle-3 Kolersky Bot;
на сайте нужно ввести запрос на русском или английском языке;
нажать «сгенерировать»;
когда изображение будет готово, нажать на кнопку «скачать».

DALL-E — генеративная нейросеть от OpenAI. Первую версию DALL-E представили в 2021 году, в 2022 году — вторую, а в 2023-м — третью — Dalle-3. Dalle-3 достаточно точно понимает и выполняет запросы пользователей, генерирует качественные, детализированные и фотореалистичные изображения. Название нейросети отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма.

Экономика инноваций Как рисует Dalle-3 — новый алгоритм OpenAI, создающий картинки из текста

2. DALL-E Mini

Как попробовать:

зайти на ресурс Hugging Face;
найти раздел dall-e;
ввести текстовое описание на английском языке, разделяя слова пробелами;
нажать Run;
когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.

Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения.

Сгенерированный коллаж от Dall-E Mini

Картинка по описанию от Dall-E Mini

Индустрия 4.0 Слова в картинках: как работает нейросеть Glif

3. Kandinsky

Как попробовать Kandinsky:

зайти на официальный сайт нейросети;
нажать «Kandinsky 3.1»;
выбрать среду, в которой удобно генерировать изображение — сайт, бот в Telegram или VK;
ввести текстовое описание в окне через пробелы на русском языке;
скачать готовую картинку.

Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).

Картинка по описанию Kandinsky

Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.

В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. В 2023 году были выпустили три новые версии — Kandinsky 2.1, Kandinsky 2.2 и Kandinsky 3.0, в 2024 году — Kandinsky 3.1. Уже Kandinsky 2.2 научился генерировать детализированные реалистичные изображения, а Kandinsky версий 3.0 и 3.1 стал это делать еще лучше.

Индустрия 4.0 Как изменилось творчество нейросетей с первых версий к концу 2023 года

4. Firefly

Как попробовать:

зайти на сайт Adobe Firefly (без VPN он не работает);
войти с помощью аккаунта Google или Discord;
ввести в строку запроса свой промпт и нажать «создать»;
откроется окно редактирования изображений, где на выбор будет четыре картинки, а также возможность поменять настройки — выбрать другую модель нейросети (сейчас доступны Firefly Image 2 и Firefly Image 3), стиль, эффект, освещение и т.д. При желании можно поменять эти настройки, применить их к одному из изображений и перегенерировать его;
загрузить изображения, которые понравились.

Картинка по описанию Firefly

Firefly — генеративная нейросеть от компании Adobe. В 2023 году ее представили как новую функцию редактора изображений Photoshop, а в 2024 как самостоятельную нейросеть в отдельном веб-сервисе.

5. Сraiyon

Как попробовать:

зайти на сайт нейросети;
зарегистрироваться, можно через аккаунт Google;
ввести свой запрос (лучше на английском) и нажать Draw;
нейросеть предложит на выбор девять вариантов изображений, любое из них можно отредактировать или нажать Upscale и скачать картинку.

Картинка по описанию Craiyon

Crayon — это генератор рисунков с искусственным интеллектом, был создан инженером-программистом Борисом Даймой. Качество сгенерированных изображений уступает некоторым нейросетям в этом материале, но зато сервис бесплатный и доступен для всех желающих в России. Кроме того, он предлагает большое количества вариантов картинок, которые можно довести до желаемого вида.

6. Easy-Peasy.AI

Как попробовать:

зайти на сайт и зарегистрироваться;
выбрать в боковом меню AI Images;
написать запрос в окне для промпта;
выбрать модель, с помощью которой хотите сгенерировать — DALL-E 3, Stable Diffusion 3.0, Stable Diffusion XL;
нажать Generate;
у сгенерированного изображения нажать Upscale, а затем Download.

Картинка по описанию Easy-Peasy.AI

Easy-Peasy.AI — это не самостоятельная нейросеть, а скорее сервис с возможностью воспользоваться некоторыми известными нейросетями в одном месте. Однако бесплатно сгенерировать получится всего несколько картинок, дальше придется оформлять подписку. Ее стоимость $5,99–28 в месяц в зависимости от тарифа.

7. Midjourney

Как попробовать:

зарегистрироваться на платформе для геймеров Discord (без VPN не работает);
зайти на официальный сайт Midjourney и авторизоваться через Discord;
выбрать и оплатить подписку — от $10 до $120 в месяц в зависимости от тарифа;
перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
ввести описание на английском языке в плашке Prompt;
кликнуть «Отправить»;
появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.

Сгенерированное изображение Midjourney

Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. Сначала нейросеть создавала изображения, похожие на детские «каляки-маляки». Но с каждой новой версией нейросеть генерировала все более точные и реалистичные изображения. Последняя версия Midjourney на данный момент — это версия 7 (Midjourney V7).

<p>Изображение, которое нейросеть YandexART сгенерировала по запросу «Нейросети будущего»</p>

Индустрия 4.0 Что такое нейросеть YandexART: детальная генерация изображений

8. «Шедеврум»

Как попробовать:

скачать мобильное приложение «Шедеврум», оно доступно на Android и iOS;
нажать на «+» и нажать кнопку «Изображение»;
написать запрос;
выбрать один из четырех вариантов изображений;
нажать «Опубликовать»;
картинка будет опубликована в ленте «Шедеврума» и в вашем личном профиле приложения;
в свою галерею на смартфоне можно сохранить, нажав на три точки в верхнем правом углу;
если не хотите, чтобы изображение оставалось в приложении, удалите его.

Коллаж по описанию «Шедеврума»

Сгенерированное изображение

Нейросеть «Шедеврум» разработал «Яндекс» и выпустил ее в апреле 2023 года. «Шедеврум» доступен только в одноименном мобильном приложении, которое работает как социальная сеть. Есть общая лента, куда публикуются сгенерированные изображения и промпты к ним, а пользователи могут подписываться друг на друга и смотреть картинки в личных профилях друг друга. В 2023 году разработчики несколько раз обновляли нейросеть, встроили в нее большую языковую модель YandexGPT для лучшего понимания запросов пользователей, и нейросеть YandexART, которая создает более реалистичные и детализированные изображения.

Экономика инноваций Что может и чего не умеет ИИ «Яндекс Шедеврум», генерирующий картинки

9. Starryai

Как попробовать:

перейти на сайт Starryai, кликнуть «Start Creating»;
пройти верификацию через Google или Apple;
выбрать опцию Altair или Orion;
в окне Prompt ввести текстовое описание на английском языке;
в окне появится картинка, которая будет преобразовываться прямо на глазах;
кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.

Картинка, сгенерированная в Altair с эффектом Concept Art

Картинка, сгенерированная в Orion с применением трех эффектов

Картинка, сгенерированная в Altair с эффектом Concept Art

Картинка, сгенерированная в Orion с применением трех эффектов

Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.

Индустрия 4.0 Нейросеть «Шедеврум» научилась генерировать видео

10. Dream by WOMBO

Как попробовать:

зайти на сайт Dream;
в окне Prompt вбить текстовое описание на английском языке;
выбрать стиль картинки и кликнуть Create;
нажать Save, также можно повторить попытку генерации, нажав Generate Again.

Картинка, которую сгенерировал сервис Dream с первой попытки

Картинка, которую сгенерировал сервис Dream со второй попытки

Картинка, которую сгенерировал сервис Dream с первой попытки

Картинка, которую сгенерировал сервис Dream со второй попытки

Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.

В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.

➤ Подписывайтесь на телеграм-канал «РБК Трендов» — будьте в курсе последних тенденций в науке, бизнесе, обществе и технологиях.