Блог

Наш первый опыт внедрения изображений, сгенерированных нейросетью, в кейс «Парки России»

Начало работы

Когда заказчик и исполнитель на одной креативной волне — вспыхивает искра, и воплощаются самые безумные идеи. Так у нас и случилось при обновлении баннеров на сайте «Парки России» с помощью нейросети Midjourney.

В кейсе рассказали про весь путь от концепции до итоговых макетов, дали несколько лайфхаков по эффективной работе с нейросетью, и, конечно, показали красоту (и не только).

Работу построили как и всегда при получении задачи: ищем варианты решений и накидываем идеи, выбираем лучшие, рассматриваем методы и способы воплощения их в жизнь.
Заказчик обратился к нам с конкретным запросом — обновить баннеры для главной страницы сайта: проект расширяется, появляются новые смыслы и слоганы, их нужно представить графически, при этом передать настроение технологичного, развивающегося проекта.
Мы продумали концепцию изображений, и перед нами встал выбор: найти подходящие готовые изображения в интернете,что вряд ли, потому что мы уже знали, что хотим видеть на баннерах, либо отрисовать картинки вручную, что занимает очень много времени, либо использовать нейросеть для генерации изображений.
Откроем секрет: мы с самого начала думали о нейросети, потому как были уверены, что пробовать нужно именно сейчас, пока не прошла волна хайпа вокруг нейросеток и такой тип визуализации еще не приелся. К тому же момент отличный — раскрутка федерального проекта «Парки России» в самом разгаре.

От идеи к осмысленной концепции

«Наполняем жизнью общественные пространства и улучшаем инфраструктуру парков».
Сложность в том, что парки могут быть совершенно разными: прогулочные, парки аттракционов, ландшафтные парки, тематические и многие другие, а кроме этого локации — самые разные уголки России с удивительной природой и достопримечательностями для активного и культурного отдыха. Поэтому нашей задачей было показать, что парки могут быть разными, но они неизменно — центры притяжения людей.
Сразу после первого обсуждения с заказчиком мы превратили в наброски все его мысли, чтобы отсеять то, что точно не подходит, и выделить лучшие мысли. И началось все со сказочных парков.


Мы сразу поняли, что это совсем не то, и быстро вернулись к реальности. Чтобы обыграть посыл «Наполняем жизнью общественные пространства и улучшаем инфраструктуру парков», попробовали изобразить солнечный день и использовать яркие цвета. Так как наш заказчик — парки, которые являются местом притяжения, нам критически важно было показать прогуливающихся людей. Мы указывали в запросе парк с людьми, загружали в нейросеть фотографии толп людей в парках, но все выходило не так, как нужно. Midjourney то делала нереалистичный парк аттракционов с людьми на заднем плане так, что их почти не было видно, то генерировала слишком мрачные картинки парков аттракционов как для фильма ужасов. Если бы мы остановились на одной из этих идей, нам пришлось бы многое переделывать руками — и смысл нейросети бы потерялся, а если бы не переделывали — то потерялся бы смысл парков как светлого центра притяжения людей.
Мы продолжили перебирать идеи, одной из которых было представить колесо обозрения точкой притяжения людей и центром композиции. Мы учли предыдущие трудности и загрузили в Midjourney фотореференсы и дополнительно написали, что нам нужен солнечный день и много зелени. Протестировали разные стилистики и отдаленность камеры, и решили остановиться, чтобы подумать ещё раз над концепцией.
Глядя на разнообразие парковых зон, мы поняли, что не можем говорить только про парки аттракционов, и что нужно показать людям все возможности проведения времени в парках, поэтому мы включили в запрос небольшие пруды, прогулочные аллеи, точки продаж еды, и так же продолжили эксперименты с углом обзора.

Для «Парков России» мы выбрали несколько сюжетов, которые легли в основу промтов (запросов в Midjourney). И тут началась борьба с нейросетью за попадание в идею и консистентность.

Подводные камни Midjourney

1. Склонность к дарк-фэнтези
Сама по себе Midjourney склонна выдавать картинки в определенной тематике — темного фэнтези. Если отдельно не прописать в запросе настроение, то с большой вероятностью вы получите что-то похожее на кадры из «Властелина колец» или последних частей «Гарри Поттера». Конечно, значение слов немного играет роль — если написать «светлый день в парке аттракционов», то вряд ли получится слишком мрачная картина, потому что это вообще трудное дело — изобразить светлый день в парке темным. Но бывало, что даже на самый простой запрос типа «парк с прудом» Midjourney выдавала нам стилизованные картинки. Поэтому мы в своих запросах всегда прописывали слова: bright light, sunny day и т. д.


2. Каждая картинка — новый проект

Нейросеть не работает в рамках длительного проекта. Можно использовать параметр seed, чтобы докручивать получившиеся картинки. Но автоматически переносить стиль на другие сюжеты не получится, потому что каждая новая генерация — это не связанная ни с чем другим задача. И это челлендж в тех случаях, когда нужен не один визуал, а целая серия в одном стиле.
Нам нужны были изображения разных типов парков. И поначалу Midjourney выдавала слишком мультяшные либо фантазийные варианты, почему-то особенно это касалось любых других аттракционов, кроме колеса обозрения, и светлых солнечных лучей.
Спустя несколько попыток мы поняли, что, если добавить в запрос однотипное описание стилистики, то парки будут органично смотреться в одной серии. Мы использовали слова: cinematic, photography, fuji color film.
Но и в описании стилистики нужно быть осторожным: любые слова могут вызвать у Midjourney ненужную ассоциацию. Например, мы хотели добиться реалистичных изображений и поэтому первые попытки запросов у нас включали слова photorealistic, ultra high quality, cinematic, photography, и нейросеть внезапно переходила на акварельные цвета с повышенной яркостью, как будто очень реалистичные рисунки.
Почему так получилось? Тут нужно вспомнить, что Midjourney обучалась работе с интернет-изображениями и их тегами. Если бы вы загрузили обычную качественную фотографию пейзажа, вы бы отметили ее как фотореалистичную?
Однако, если бы вы увлекались ультрареалистичными рисованными картинами, вы бы как создатель пометили их именно так. Поэтому, когда мы использовали любой из «реалистичных» терминов, мы указывали Midjourney не на фотографии, а именно на реалистичные картинки. Таким образом, вводя термины вроде ultrarealistic, high resolution и т.д. вы лишь отдаляете свое изображение от фотографического качества.

3. Золотая середина

Американские горки без начала и конца, неправдоподобные ноги, колеса колесо обозрения в виде осьминога — это только полбеды. У Midjourney такая бурная фантазия, что не так просто заставить ее сделать то, что вы себе напредставляли.
Кажется, что самый логичный способ решить эту проблему — создать максимально детальный промт. Но, как ни странно, это всё делает только хуже.
Мы почти сразу нашли выход: не прописывать каждый элемент изображения, а задать общее направление, например, «парк аттракционов с людьми, деревьями и зеленью в солнечный день» — и Midjourney сама подберет идеальный образ.
Несмотря на все сложности, добиться классного результата — возможно. Особенно, если уже накопил парочку лайфхаков. К тому же нейросеть постоянно развивается. Например, еще в августе Midjourney генерировала восьминогих лошадей, и вот спустя несколько месяцев стала в этом плане более точной.

4. Midjourney + Photoshop = ❤️

Когда мы получили свои изображения, то озаботились тем, чтобы убрать все артефакты. Для этого мы использовали Photoshop: выделили на картинке места, где чего-то не хватало, стерли детали, которые нужно было заменить — и вуаля.

Что в итоге?

Мы хотели попробовать технологию на волне популярности, оценить трудозатраты и посмотреть, выстрелит ли. Главным для нас был эксперимент.
И хоть о преимуществах для проекта «Парки России» говорить еще рано, потому что его запуск в самом разгаре, некоторые выводы мы уже сделали — нейросети помогли нам:
  1. Реализовать идею и быстро показать задуманные сюжеты, которые родились в голове. На стоках такого не найти.
  2. Достаточно быстро подготовить креативы (с учетом того, что мы договорились не обращать внимания на некоторые косяки нейросети типа количества пальцев). Сроки разработки подобного вручную — до 5 дней на одну картинку, а у нас на всё от штурма до реализации ушло 3 дня;
  3. Сделать много разного контента в одной стилистике.Теперь заказчик может распределять контент по времени, чтобы в разное время удивлять аудиторию чем-то новеньким.
Будем ли мы еще использовать нейросети, зависит от того, не пропадет ли к ним всеобщий интерес. Если технология продолжит и дальше развиваться, то мы попробуем использовать ее и для других целей. Конечно, хочется и дальше использовать нейросети для поиска идей и генерации креативов, и как инструмент для решения самых разных задач. Например, мы подумали, что можно использовать Midjourney для создания создания корпоративных игр и мерча, для концептов на этапе пресейла — чтобы быстро и дешево показать, в какую сторону в проекте мы можем пойти.
А итоговую работу вы можете посмотреть на сайте «Парки России».
Жизнь компании DK.Design