Искусственный интеллект, 22 авг, 15:02

Как пользоваться Midjourney: команды, настройки и примеры

Читать в полной версии
Фото: Midjourney
С помощью Midjourney можно не только генерировать изображения, но даже «скрещивать» картинки, создавать персонажей и стили. 21 августа 2024 года был открыт бесплатный доступ к веб-сервису с лимитом 25 картинок в сутки

Содержание:

Midjourney — это система на базе искусственного интеллекта, которая создает изображения из подсказок пользователя. Нейросеть разработала одноименная американская компания, основанная ученым и бывшим сотрудником Института Макса Планка Дэвидом Хольцем. В середине июля 2022 года Midjourney стала доступной для пользователей по всему миру. Midjourney по сравнению с другими нейросетями обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом.

Нейросеть рисует: 10 способов создать картинку по фото или описанию
Экономика инноваций 

В бесплатной версии можно сгенерировать 25 сетов изображений. Кроме того, Midjourney предлагает платные тарифы стоимостью от $8 до $96 в месяц. Первый дает право на генерацию 200 картинок и доступ к галерее работ участников. Самый дорогой план дает доступ к 60 часам быстрых генераций. Для доступа к боту Midjourney на Discord также теперь требуется подписка. Однако оплатить ее с российской карты не получится — потребуется карта иностранного банка и VPN.

Как пользоваться веб-версией Midjourney

21 августа 2024 года разработчики запустили сайт Midjourney, который до этого находился в режиме бета-тестирования. Пока он бесплатный для всех пользователей, а после регистрации можно сгенерировать до 25 картинок в день в высоком качестве.

Чтобы воспользоваться сайтом Midjourney, нужно:

  • перейти на сайт;
  • кликнуть «Log in» и авторизоваться на cайте через аккаунт Google или Discord;
  • согласиться с условиями использования и нажать «Start Creating»;
  • нажать «Create» в левом верхнем углу, и появится окно для генерации картинок с полем для ввода запроса и историей прошлых работ.
  • ввести текстовый запрос на английском языке и нажать Enter.

Midjourney выдаст сет из восьми картинок, каждую из которых можно скачать или дополнительно отредактировать. Редактируем выбранную картинку с помощью опции Vary subtle (генерировать похожие изображения).

Из сгенерированного сета из четырех картинок выбираем одну для скачивания и нажимаем значок стрелки справа для ее загрузки.

Как пользоваться Midjourney в Discord

Для того, чтобы воспользоваться возможностями нейросети, потребуется учетная запись в сервисе для геймеров Discord. Далее нужно:

  • запустить приложение Discord или открыть веб‑версию в браузере;
  • зайти на сервер с Midjourney;
  • выбрать один из чатов Newbie, где создают картинки пользователи;
  • ввести команду /imagine;
  • в окне promt ввести текстовое описание на английском языке и отправить его в чат;
  • согласиться с условиями сервиса, нажав зеленую кнопку Accept ToS;
  • Midjourney выдает коллаж из четырех картинок, каждую из которых можно сохранить или продолжить улучшать;
  • под получившимися картинками будут кнопки U и V. U позволяет увеличить разрешение выбранной картинки, а V — создать к одной из них дополнительные версии. Далее нужно нажать кнопку со стрелочками для новой генерации;
  • после выбора изображения для увеличения оно появится в чате. Под картинкой будут следующие кнопки:

    Make Variations — еще четыре новых изображения;

    Light / Beta Upscale Redo — увеличение размера с меньшим количеством деталей или с большим разрешением;

    Web — по ссылке изображение открывается в галерее Midjourney, где будут храниться все генерации пользователя;

  • получившуюся картинку сохраняем на носитель.

Midjourney можно пользоваться как на общем сервере, так и добавить на свой, если он насчитывает не более 10 тыс. участников. Для этого понадобится нажать на бота в списке пользователей справа и выбрать «Добавить на сервер».

Что такое Discord и для чего он нужен
Индустрия 4.0 

Настройка Midjourney

Перед тем, как сгенерировать картинку, можно заранее выбрать ее стиль, размеры и установить другие параметры.

В веб-версии

В этой версии Midjourney выбор параметров простой — достаточно кликнуть на значок с ползунками справа от поля ввода запроса, и появится выпадающее окно со всеми предварительными настройками.

Настройка параметров в веб-версии Midjourney (Фото: www.midjourney.com)

В этом окне можно настроить размер изображения (Image Size), режим генерации (стандартный или более креативный, Standart и Raw), версию нейросети (самая новая — 6.1), включить опцию персонализации (Personalize), настроить уровень стилизации (Stylization), «странности» картинки (Weirdness) и вариативности генераций (Variety). Можно также выбрать режим скорости генерации, но опции Fast и Turbo на бесплатном тарифе имеют ограничения.

В Discord

На сервере Midjourney в Discord есть несколько каналов: в Announcements размещают объявления от разработчиков, в Status сообщают о технических проблемах, в Rules размещают правила для пользователей.

Чтобы предварительно настроить параметры генерации, нужно в чате Newbie отправить команду /settings и в появившемся окне параметров настроить версию движка, качество изображения, выбрать уровень стилизации и другие параметры.

Опции редактирования в Midjourney

При генерации и редактировании картинок можно использовать множество дополнительных параметров. Рассмотрим некоторые из них:

  • Vary (Strong) — генерирует новое изображение, беря за основу текущее;
  • Vary (Subtle) — генерирует новое изображение, похожее на исходное по композиции и стилю, но с большей детализацией;
  • Rerun — перезапустить промпт;
  • Edit — редактировать элементы изображения;
  • Upscale (Subtle и Creative) — в первом случае изображение увеличивается, а во втором к нему добавляются дополнительные детали.

Как правильно сформулировать запрос к Midjourney

Длина промпта в последней версии Midjourney v6 может достигать 350 слов. Для того, чтобы картинка получилась релевантной описанию, нужно следовать определенным правилам при составлении запроса. Разработчики выдали несколько базовых рекомендаций:

  • использовать более конкретные слова — «big» лучше заменить на «tiny», «huge», «giantic» или «massive»;
  • избегать слов во множественном числе и собирательных существительных — «three cats» лучше «cats», а «flock of birds» звучит точнее, чем просто «birds»;
  • избегать упоминаний объектов, которые вы не хотите видеть на картинке. Чтобы гарантировать, что они не будут сгенерированы, можно внедрять расширенные подсказки с помощью параметра --no;
  • создавать более подробные промпты, так как короткие подсказки обычно полагаются на стиль Midjourney по умолчанию;
  • стараться указывать в промпте его тему (человек, животное, персонаж, местоположение, объект), средства (фотография, живопись, иллюстрация, скульптура, рисунок, гобелен), окружающую среду (в помещении, на улице, на Луне, под водой, в городе), освещение (мягкое, окружающее, пасмурное, неоновое, студийное), цвет (яркий, приглушенный, монохромный, пастельный), настроение (уравновешенное, спокойное), композицию (портрет, крупный план, вид с высоты птичьего полета);
  • в запросе можно использовать набор команд, чтобы максимально точно настроить параметры картинки:
  1. --tile — генерирует изображения, которые можно использовать в качестве повторяющихся для создания бесшовных узоров тканей, обоев и текстур;
  2. --style — параметр, который позволяет более строго следовать инструкциям в запросе вместо того, чтобы использовать стиль, который по умолчанию применяет модель.
  3. -ar — «соотношение сторон». По умолчанию картинки генерируются в соотношении 1:1;
  4. -video — команда сохранения видео процесса генерации.

Также пользователи рекомендуют помещать самые важные объекты и элементы картинки в начало запроса и избегать таких понятий, как:

  • 4k, 8k, 16k, 32k;
  • photorealistic, ultra-realistic, hyper-realistic,
  • high-resolution, HD, UHD, Full HD, Ultra HD,
  • unreal engine, octane render,
  • award-winning,
  • masterpiece, insane piece,
  • amazing, awesome, incredible, crazy, excellent и подобных.

Кроме того, есть сервисы, которые помогут составить правильный запрос. В их числе — Promptomania, Prompter, Prompt helper и Noonshot.

Аватарки, логотипы, тексты в блоги: подборка интересных нейросетей
Индустрия 4.0 

Возможности Midjourney

С помощью нейросети можно не только генерировать картинки. Она также позволяет:

  • создать аватар. Для этого нужно в боте вызвать настройки через команду /settings и включить Remix mode. Затем после команды /imagine следует указать ссылку на фото — например, на страницу в соцсети «ВКонтакте» или на любом открытом хостинге — в соцсети и прописать нужные параметры. Так, при генерации можно, например, указать параметры стилизации под любимый мультфильм или сериал («like Simpsons» или «Star Wars hero»).
    Исходное фото (справа) и результат генерации по запросу «A lost in a magic Miyazaki field girl rising sun warm light bird's eye view-ar 3:4» (Фото: www.midjourney.com)
  • «скрестить» изображения. Для этого также потребуется ввести команду /settings и включить Remix mode. Далее нужно указать после /imagine две ссылки на любые изображения. При этом картинки могут быть посвящены как живым персонажам, так и предметам. 
    Скрещиваем свою аватарку с картинкой Дональда Дака (Фото: www.midjourney.com)

Также нейросеть помогает сгенерировать новые логотипы, комиксы, обои и игровых персонажей.

Искусственный интеллект Нейросети IT Внедрение инноваций
Главное