Что такое нейросеть Kandinsky 2.2
Kandinsky 2.2 — это обновленная версия нейросети Kandinsky 2.1, которую «Сбер» выпустил в апреле. Нейросеть умеет генерировать изображения по запросу пользователя. Kandinsky 2.2, как ее предшественники и аналоги, работает на основе диффузионной модели, которая сначала размывает изображение, а потом пытается его восстановить, создавая в итоге новое.
Возможности нейросети Kandinsky 2.2
Kandinsky 2.2 так же, как и Kandinsky 2.1, умеет генерировать изображения по текстовому запросу в 21 стиле, смешивать несколько картинок, смешивать картинки и текст, делать вариации уже готовых изображений.
Среди новых возможностей нейросети:
- разное соотношение сторон. Раньше картинку можно было генерировать только в формате 1:1. Теперь появились — 16:9 (1024х576 пикселей), 9:16 (576х1024), 3:2 (1024х680) и 2:3 (680х1024);
- генерация фотореалистичных изображений с более высоким качеством;
- генерация стикеров;
- структурный блок ControlNet, который позволяет менять только часть изображения, сохраняя исходную композицию.
Как пользоваться нейросетью Kandinsky 2.2
Воспользоваться нейросетью можно бесплатно в нескольких источниках:
- в Telegram-боте;
- на сайте fusionbrain.ai;
- на сайте rudalle.ru;
- на сайте «Сбера».
Чтобы сгенерировать картинку, нужно написать запрос (промпт). На сайте «Сбера» приводится самая простая формула — объект + фон + стиль. Кроме того, промпт должен быть как можно более детальным и содержать в описании конкретные предметы, а не абстрактные понятия.
Примеры использования нейросети Kandinsky 2.2
«РБК Тренды» написали несколько запросов и сгенерировали изображения с помощью обновленной нейросети.