Кот небесный
fotovivo — 01.12.2023«Снежок»:
Первый пятничный котик декабря.
Решила попробовать, как нейросети справятся с нехитрым сюжетом — «котик, сбрасывающий снежки на землю». Сделала себе выкраску на картонке, пример — чего хотелось бы добиться от ИИ.
Леонардо,
самый продвинутый из «Диффузий», обвешанный дополнительными
(платными) «алхимиями», дает качество картинки не хуже Миджорни
(полугодовой давности, позже не пробовала):
Картинки открыточного качества.
Вот только с пониманием задания — раз на раз не приходится.
И, если не пришлось, то хоть как изощряйся с формулировками,
скобками (для выделения ключевых объектов), меняй слова местами,
задавай короткий четкий промт или развернутое описание пейзажного
полотна — самое близкое, что удается получить: летящего на облаке
натурального мехового кота, а не облако в форме котика (варианты:
кот-облако; облако-кот; кот из кучевых облаков; облако похожее на
кота; и тд — с тем же результатом)
Зато иллюстрации — загляденье.
Самые крутые из нейросеток на основе «SD» мало продвинулись за
последние месяцы в понимании промтов, зато наловчились мухлевать —
«мы так и не поняли, что нужно сделать, но отрисуем классный
постер, авось пользователю понравится».
еПлюс постепенно расширяются области охвата, на которые их
натаскали — к фигуристым манкенщицам, пейзажам и
кибер-героике добавили множество других моделей, заранее
настроенных на определенный стиль — «пряничные домики», «пираты»,
«пластилин», «картина из овощей/оригами/хрусталя»,
«кельты/позолота/анимэ»...
Но чего нет, того с нуля не получишь
Коты прикольные, используя их для коллажа, доработать картинку под заданную идею несложно. Однако это все-таки наполовину ручная работа -
— к такому только снежок дорисовать
Разные «модели» дают разный рисунок, настолько же далекий от
заданного.
Чем больше уточняешь требования к сюжету, тем отстойней графика,
появляются лишние лапы и хвосты, как на ранних стадиях развития
ИИ
Wepik,
неплохо продвинулся в качестве
рисунка (когда-то забраковала его, как полный отстой), «милота» и
атмосферность местами даже превосходят леонардовские. Но с сюжетом
те же грабли:
Котик есть, снежки есть, облака есть, когда-то нейрогенерация
лихо смешивала всех со всеми, выдавая результат с презабавнейшими
монстрами и химерами. Тогда бы наверное «Кота с
облаком? — Легко!»
Увы, теперь уже так не поиграешь — обратная сторона прокачки
фотореализма
Ненастроенная «Диффузия-автоматик1111» - на компьютре:
Как ни странно, смысл задания поняла на раз.
Но при попытке добиться более фотографичной картинки, идея потерялась:
Типа — или получай картинку поприличнее, на основе скормленных в период обучения изображений, или без предустановок очень схематичное изображение:
Надстройка на системной Диффузии — Fooocus (от разработчика ControlNet)
Версия «анимэ-арт» — в красивости не откажешь!
С пониманием все то же.
Версия «реал» — фото-реализм неплохой, но грустноват и в красках жухловат, возможно отражение авторских предпочтений
Dezgo — слабенький сервис, почти на уровне моей домашней
непрокачанной Диффузии. (Но случаются и на нем прозрения, потому
оставила под рукой)
Playground —
на нем предустановленных моделей больше, чем где бы то ни было
(некоторые занятные). Картинка не хуже, чем у других.
С пониманием — все аналогично:
Еще один былой «аналог Миджорни» BlueWilloy.
Либо красиво — либо близко к требуемому, но графика
грубеет и появляются дефекты, казавшиеся изжитыми:
Limewire
поглотивший BlueWilloy, настойчиво продвигает про-апгрейд, пять
картинок в день дает на пробу
однако результат показывает не убедительный.
Один раз угадал, кото-облако в точку, но стрёмное:
Кст. у Лайма среди опций есть подключенный:
Google imagen,
сам по себе доступный ограниченно (в лист ожидания можно записаться)
Что-то Гугл припозднился, Диффузия так рисовала год назад (нестабильно — то терпимый результат, то жуткий треш)
Хотя считывание промта удовлетворительное (через раз) - действительно белый котик на облаке.
Диффузия от NightCafe старается и даже кое-где почти попадает, пытается именно кидать снежки. Или скрестить кота с облаком и город внизу показать. Но не то и другое сразу:
Креатив-Студио, сервис с очень разнопестрым функционалом и нестабильным результатом. Умеет в текст-ту-гиф:
Кандинский,
кажется уже 3, вроде бы
отпочковавшийся от Дали-Е. Понимает по-русски, смысл отчасти
воспроизвел, но в целом качество так себе, отстает от
навороченной СД
Фотошоп — генеративная заливка:
Вообще трудно судить, результат бывает очень разный, то
чуть ли не Mj, то на уровне недоведенного до ума
«автоматика».
В нижнем ряду снежок дорисовала — на то ж он и фотошоп =)
Примеры промтов, на всех сервисах пробовала
одинаковые,
все чисто смысловые, краткие и развернутые, в разных
формулировках;
освещение, объективы меня устраивают по дефолту; «нарисуй как
художник такой-то» — не использую, как и свою картинку в
качестве основы,
чистоты эксперимента ради:
Кот из облаков, пушистый, светло-серебристый с белыми полосками,
сидит на слое облаков и кидает на землю снежки, внизу деревня, над
облаками темное небо.
A cat from the clouds, fluffy, light silver with white stripes,
sits on a layer of clouds and throws snowballs on the ground, there
is a village below, a dark sky above the clouds
Облачный кот кидает с неба снежки
Cloud cat throws snowballs from the sky
Из облака в форме кота падают снежки, зимний пейзаж с уровня
облаков
Snowballs are falling from a cat-shaped cloud, winter landscape
from cloud level
Облако в форме кота сбрасывает вниз снежки, зимний пейзаж с уровня
облаков.
Сloud in the shape of a cat, a winter landscape from the cloud
level.
A cloud cat, there is a village below, a dark blu sky above the
clouds
Жемчужно-белый в полосочку кот из кучевых облаков плывет по синему
небу и кидает снежки на заснеженный город
A pearly white striped cat made from cumulus clouds floats across
the blue sky and throws snowballs at the snowy city
Попытки извернуться с «котик в небе над городом из - клубов дыма, пара, тумана...», оказались безуспешными, не удалось втолковать нейросети, что мне не нужен «дымящийся котик»
И, к слову, с прочими «из» тоже все оказалось не просто — еще недавно нейросеть это умела! Лихо составляла предметы и картины из чего угодно с чем угодно, а теперь туго и нехотя: котик из стекла и льда? — пожалуйста, хоть так, хоть в специальных «моделях»
а «из шариков надувных» — так себе результат:
хотя казалось бы обычное дело, полно фоточек по запросу «искусство моделирования из шариков»
«Из дыма и пара» справился только Бинг,
но и с облаками прекрасно справился
Bing —
вот этот круто рванул в последние недели. И качество картинки очень даже и, главное, — понимать промты научился, уже не первый сюжет - схватывает с полу-слова:
при повторных генерациях меняет композицию и стиль
Правка иллюстрации если и требуется, то минимальная, по сравнению с остальными
Немного начинает косячить и Бинг, если слишком уж настаивать на задуманной динамике. Описать котика как «мягкую игрушку», чтоб не отрисовывался реальный живой кот, тоже не прокатило