Читайте РБК без баннеров

Подписка отключает баннерную рекламу на сайтах РБК и обеспечивает его корректную работу

Всего 99₽ в месяц для 3-х устройств

Продлевается автоматически каждый месяц, но вы всегда сможете отписаться

Ученые объяснили, как фантазируют компьютеры

Фото: РБК Тренды
Фото: РБК Тренды

Что: ученые MIT выпустили тест креативности для нейронных сетей, а точнее — для GAN (Generative Adversarial Networks), генеративных состязательных сетей. Это алгоритм машинного обучения без учителя, в котором «состязаются» две нейросети: одна генерирует образцы (генератор), а другая пытается отличить правильные образцы от неправильных (дискриминатор).

В чем суть: человек может представить пожарный грузовик синего цвета, даже если он такой никогда не видел, а алгоритм — нет. Он учится на данных, которые есть у него в распоряжении.

Фото: MIT
Фото: MIT

Ученые сделали следующее: они взяли GAN, которые уже изучили 14 млн фотографий из ImageNet, «направили» модели на определенные элементы фотографий и попросили их изобразить эти объекты в приближении, в ярком свете, развернутыми в пространстве или раскрашенными в разные цвета. Цель исследования — понять, могут ли нейросети представить наш трехмерный мир во всем его многообразии.

Результаты: по мнению ученых, такие эксперименты помогут в том числе разобраться, какие креативные приемы используют люди, чтобы запечатлеть реальность перед объективом.

Фото: MIT
Фото: MIT

Например, красный воздушный шар нейросеть смогла представить в разных ракурсах, а вот развернуть пиццу у нее не получилось. Уменьшение зума превратило кота в лужу шерсти, а вот малиновка оставалась четкой вне зависимости от расстояния. Модель легко перекрасила машину в голубой и медузу — в красный, но отказалась представлять пожарную машину и щегла в каких-либо других цветах, кроме стандартных. При затемнении горного пейзажа модель добавила извержение вулкана — как будто понимала, что это единственный источник освещения в темноте.

Что это значит: несмотря на то, что алгоритмы нейросетей становятся все более сложноустроенными, они все еще опираются на данные. Их креативный процесс основывается на предвзятости и стереотипах тысяч фотографов в том, какие ракурсы и темы они используют, и как изображают объекты перед объективом. Пока что нейросети не способны представить физический мир в концептуальном разнообразии — в отличие от людей.


Подписывайтесь на Telegram-канал РБК Тренды и будьте в курсе актуальных тенденций и прогнозов о будущем технологий, эко-номики, образования и инноваций.

Следующий материал: