Нейросеть рисует: 7 способов создать картинку по фото или описанию

Разбираемся, как создать изображение с помощью нейросети
Разбираемся, как создать изображение с помощью нейросети (Фото: Dalle-3)
Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые нейросети бесплатны и доступны всем желающим

Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. «РБК Тренды» подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).

Фото:Freepik
Индустрия 4.0 Что такое нейросеть: как устроен человеческий мозг «в цифре»

Содержание:

1. DALL-E

Как попробовать:

  • в платной подписке ChatGPT Plus (в России без VPN не доступен) за $20 в месяц;
  • через бесплатный сайт Dall-E 3 или бот в Telegram Dalle-3 Kolersky Bot (₽490 для 50 генераций), однако в обоих случаях картинки генерируются только размером 1024х1024 px;
  • на сайте нужно ввести запрос на русском или английском языке;
  • нажать «сгенерировать»;
  • когда изображение будет готово, нажать на кнопку «скачать».

DALL-E — генеративная нейросеть от OpenAI. Первую версию DALL-E представили в 2021 году, в 2022 году — вторую, а в 2023-м — третью — Dalle-3. Dalle-3 достаточно точно понимает и выполняет запросы пользователей, генерирует качественные, детализированные и фотореалистичные изображения. Название нейросети отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма.

Фото:Dalle-3
Экономика инноваций Как рисует Dalle-3 — новый алгоритм OpenAI, создающий картинки из текста

2. DALL-E Mini

Как попробовать:

  • зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
  • найти раздел dall-e;
  • ввести текстовое описание на английском языке, разделяя слова пробелами;
  • нажать Run;
  • когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.

Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.

Фото:Glif
Индустрия 4.0 Слова в картинках: как работает нейросеть Glif

3. Kandinsky

Как попробовать Kandinsky:

  • зайти на официальный сайт нейросети;
  • нажать «Kandinsky 3.0»;
  • выбрать среду, в которой удобно генерировать изображение — сайт, бот в Telegram или VK;
  • ввести текстовое описание в окне через пробелы на русском языке;
  • скачать готовую картинку.

Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).

Картинка по описанию Kandinsky
Картинка по описанию Kandinsky

Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.

В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. В 2023 году были выпустили три новые версии — Kandinsky 2.1, Kandinsky 2.2 и Kandinsky 3.0. Уже Kandinsky 2.2 научился генерировать детализированные реалистичные изображения, а Kandinsky 3.0 стал это делать еще лучше.

Фото:Dalle-3
Индустрия 4.0 Как изменилось творчество нейросетей с первых версий к концу 2023 года

4. Midjourney

Как попробовать:

  • зарегистрироваться на платформе для геймеров Discord;
  • зайти на официальный сайт Midjourney и авторизоваться через Discord;
  • выбрать и оплатить подписку — от $10 до $120 в месяц в зависимости от тарифа;
  • перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
  • ввести описание на английском языке в плашке Prompt;
  • кликнуть «Отправить»;
  • появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
  • нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.

Сгенерированное изображение Midjourney
Сгенерированное изображение Midjourney

Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. Сначала нейросеть создавала изображения, похожие на детские «каляки-маляки». Но с каждой новой версией нейросеть генерировала все более точные и реалистичные изображения. Шестая версия, выпущенная в декабре 2023, генерирует настолько качественные картинки, что их может быть сложно отличить от реальных фотографий и рисунков.

<p>Изображение, которое нейросеть YandexART сгенерировала по запросу &laquo;Нейросети будущего&raquo;</p>
Индустрия 4.0 Что такое нейросеть YandexART: детальная генерация изображений

5. «Шедеврум»

Как попробовать:

  • скачать мобильное приложение «Шедеврум», оно доступно на Android и iOS;
  • нажать на «+» и нажать кнопку «Изображение»;
  • написать запрос;
  • выбрать один из четырех вариантов изображений;
  • нажать «Опубликовать»;
  • картинка будет опубликована в ленте «Шедеврума» и в вашем личном профиле приложения;
  • в свою галерею на смартфоне можно сохранить, нажав на три точки в верхнем правом углу;
  • если не хотите, чтобы изображение оставалось в приложении, удалите его.

Нейросеть «Шедеврум» разработал «Яндекс» и выпустил ее в апреле 2023 года. «Шедеврум» доступен только в одноименном мобильном приложении, которое работает как социальная сеть. Есть общая лента, куда публикуются сгенерированные изображения и промпты к ним, а пользователи могут подписываться друг на друга и смотреть картинки в личных профилях друг друга. В 2023 году разработчики несколько раз обновляли нейросеть, встроили в нее большую языковую модель YandexGPT для лучшего понимания запросов пользователей, и нейросеть YandexART, которая создает более реалистичные и детализированные изображения.

Фото:«Яндекс»
Экономика инноваций Что может и чего не умеет ИИ «Яндекс Шедеврум», генерирующий картинки

6. Starryai

Как попробовать:

  • перейти на сайт Starryai, кликнуть «Start Creating»;
  • пройти верификацию через Google или Apple;
  • выбрать опцию Altair или Orion;
  • в окне Prompt ввести текстовое описание на английском языке;
  • в окне появится картинка, которая будет преобразовываться прямо на глазах;
  • кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.

Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.

Фото:пресс-служба «Яндекса»
Индустрия 4.0 Нейросеть «Шедеврум» научилась генерировать видео

7. Dream by WOMBO

Как попробовать:

  • зайти на сайт Dream;
  • в окне Prompt вбить текстовое описание на английском языке;
  • выбрать стиль картинки и кликнуть Create;
  • нажать Save, также можно повторить попытку генерации, нажав Generate Again.

Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.

В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.

Обновлено 05.03.2024
Главная Лента Подписаться Поделиться
Закрыть