Слова в картинках: как работает нейросеть Glif
Содержание
Что такое Glif
Glif — это сервис, который позволяет вписать заданный текст в изображение таким образом, чтобы это выглядело естественно. При этом алгоритм использует игру теней, особенности естественных ландшафтов или позы людей или животных. В работе сервиса задействованы такие модели, как ChatGPT, Stable Diffusion и Kandinsky. При этом одна нейросеть генерирует изображение, а вторая вставляет в него нужную надпись.
Разработчики сервиса предлагают еще множество опций, в том числе по генерации логотипов и комиксов, пейзажей «Лего» и даже персонажей в стиле «Твин Пикс». На Glif можно комбинировать работу разных нейросетей и создавать новые мини-сервисы.
Платформа поддерживается независимым сообществом энтузиастов, и поэтому ее сервисы — полностью бесплатные.
Как пользоваться Glif
Чтобы создать картинку, нужно перейти на сайт Glif и зарегистрироваться через Google или Discord. После этого нужно выбрать функцию Controlnet Any Word. Затем потребуется заполнить три поля внизу:
- в поле Prompt ввести текстовое описание картинки на английском языке;
- в Single short word to render нужно ввести заглавными буквами и на любом языке слово, которое требуется зашифровать;
- в поле Font size нужно задать размер шрифта (от 100 до 170).
Спустя несколько секунд сервис сгенерирует изображение. Его можно скачать в хорошем качестве, нажав на стрелку загрузки справа.
Тестируем работу сервиса Glif
Редакция «РБК Трендов» решила опробовать возможности Glif, чтобы понять, есть ли у нейросети ограничения, которые нужно учитывать.
В целом картинки с короткими закодированными словами получаются более читаемыми, а изображения с закодированными фразами лучше читаются с более далекого расстояния.
Примеры работ в Glif
Пользователи делятся примерами картинок, которые им удалось сгенерировать с помощью сервиса. Выбрали интересные варианты.