Первый день с домашним Stable Diffusion

топ 100 блогов kvisaz20.02.2023 Я собрал сетап под рисовалку, установил интерфейс и одновременно инсталлятор Stable Diffusion отсюда, нахапал моделей с civitai.com и погрузился в прохладные воды экспериментов. Никогда, со времен первого знакомства со вторыми Героями Магии и Меча, я не испытывал такого азарта. Сначала я тыкал на все кнопки подряд и это было чистое казино, только с каким-то минимальным выигрышем на каждом ходу. Затем немного освоил командный язык и настройки мутатора Img2Img (документация). Испытал болезненное чувство - эх, такую бы вещь хотя бы лет 10 назад. А двадцать? А сто! Ах, если бы у Леонардо да Винчи был компьютер, атомный реактор и штатный Илон Маск! Но к черту сожаления, я чувствую удовольствие и это достаточная награда для жизни.

Уроки первого дня с домашним Stable Diffusion и его клонами (моделями, обученными на специфические задачи):

0. Да, модель имеет значение, но даже специализированная модель просто так не отдаст шедевр. С пустым запросом (промптом) все модели генерируют сиреневый или серый туман. Нужно заклинание. Некоторые заклинания сильнее остальных.

1. Пожалуй, самое важное в заклинании, что я бы советовал новичку и что сам охотно использую сейчас - это стиль. То есть словесное описание общей характеристики картины. Моя первая находка... ну как находка, конечно же, я подрезал ее у других - это

'Matte Painting, soft light, pastel colors, cozy atmosphere'.

Изначально она была в примере с какими-то завтраками, но я обнаружил, что добавление этого хвоста к любой описательной части генерирует достойную (на мой взгляд дилетанта) иллюстрацию. На любой модели! Даже на порно-моделях, даже с запросами типа Doom Slayer или "битва ведьм и демонов в средневековой таверне" это заклинание, которое я обозвал как 'Matte breakfast', добавляет свой шарм.

К примеру, 'nice girl looking, cup of coffee, on street' становится из фотореализма таким

Первый день с домашним Stable Diffusion

2. Второй прием, что я бы советовал новичку - как можно быстрее обратить внимание на вкладку img2img. Это мутатор, стилизатор, миксер, волшебник, ксерокс для композиции. Он позволяет взять за основу одну картинку и накладывать на нее генерации из промпта с заданной степенью слияния.

Я закинул предыдущую картинку и добавил 'in space' в заклинание. Ах да, я забыл сказать - девушка изначально была с пивом. Это я уже тут поменял его на кофе в тексте.

Первый день с домашним Stable Diffusion

За каждый запуск Img2Img генерит из промпта N новых вариантов (параметр Batch count/Batch size, я пользуюсь пока только первым), смешивает их с исходником со степенью Denoising Strength, где
- 0 оригинал остается
- 0.25 оригинал начинает получать слабую стилизацию
- 0.5 попытка смешать оригинал и новую генерацию в равных пропорциях, при сильном расхождении будет разрыв композиции, неприглядная мутация, долина отвращения и смерти
- 0.75 новый вариант побеждает, от оригинала остается слабая стилизация
- 1 полностью новый вариант, практически аналог обычного режима text2img

У меня было 8 вариантов, я использовал право на безвкусицу и выбрал этот. Как видите, Img2Img сохранил базовую композицию. Когда промпт исходника и новых вариаций близки, такое происходит часто. Тяжело совмещать только совершенно разные идеи.

Первый день с домашним Stable Diffusion


Img2Img - это идеальный на данный момент мутатор, чтобы довести вариант до нужной кондиции. К примеру, я запросил Doom Slayer (героя игры Doom) со стилем 'Matte breakfast', который сохранил ранее (и описан выше).

Первый день с домашним Stable Diffusion

вВыбрал из 8 вариантов этот за наибольшую живость, похожесть и меньшее число артефактов. Слова в промпте влияют на все предметы, поэтому Doom Slayer получил средневековую броню. Закинул его в мутатор. Промпт менялся незначительно, я просто хотел перебрать варианты, поэтому поставил силу смешивания в 0.5  (Denoising Strength)

Первый день с домашним Stable Diffusion

После нескольких мутаций выпала комбинация без шлема и с дополнительным человеком в таверне. Оставил. Пальцы... Ну что пальцы! Господа, перед нами ветеран бесконечных войн, с сильными жилистыми шрамированными конечностями, с бесконечным числом возрождений и регенераций. Другие мужики на его месте выглядели бы не лучше с 50 HP. Дайте спокойно попить пиво!

Первый день с домашним Stable Diffusion


Все это я гонял на модели Protogen Anime 2.2

Как видите, текстовый запрос перешибает основной стиль модели как соплю. Точнее, надо говорить так - Стиль модели помогает сильнее раскрыться некоторым промптам.

Порно-модели хорошо раскрывают порно-запросы и могут генерировать бесстыжие позы с анатомической корректностью (не всегда). Аниме-модели богаче раскрывают аниме-заклинания. Все они могут рисовать в разном стиле, как и живые художники - искусствоведы подтвердят!

Просто запрос 'My Little Pony Friendship is Magic'  + стиль 'Breakfast Matte', описанный выше, генерирует пони в таком стиле

Первый день с домашним Stable Diffusion

без этого стиля те же пони, тот же 'My Little Pony Friendship is Magic' выглядит так

Первый день с домашним Stable Diffusion


Я выбрал вот эту лошадку, поскольку меня никто не мог остановить в этом

Первый день с домашним Stable Diffusion

И попробовал ее скрестить с Doom Slayer. Даже с использованием общего стиля на силе смешивания 0.5 возник разрыв композиции. Не удалось совместить коня и ветерана!

Первый день с домашним Stable Diffusion

Тогда я установил силу смешивания на 0.25 и возникла легкая стилизация

Первый день с домашним Stable Diffusion

Прогнал раз 4 или 6 на 0.25 с тем же промптом, плавно повышая градус безумия и решил остановиться тут

Первый день с домашним Stable Diffusion

Художник нарисовал бы лучше. Или опытный пользователь нейронки синтезировал бы более удачно. Но я не опытный.

Первый день с домашним Stable Diffusion

Дополнительные детали
- Нейронка работает как локальный веб-сервер, под капотом - консольное приложение, которое иногда скачивает недостающие части (один раз).

Первый день с домашним Stable Diffusion

- сделать качественный дипфейк я не могу, но инструмент при ловкости рук, похоже, это позволяет. Можно выделять только часть картинки и мутировать только ее, как я сделал это для приятеля

Первый день с домашним Stable Diffusion

Ну, тут я просто сначала извлек текст из фото...

Да, еще один важный прием - кнопка "Допросить", то есть Interrogate CLIP. Она извлекает из положенного в Img2Img оригинала текстовое описание. Это описание не гарантирует воспроизведение картинки в чистом синтезе, но она позволяет извлечь близкие смыслы, что облегчает мутацию фотографий или исходников, полученных натуральным, не синтезированным в нейронном автоклаве, путем.

Значит, я извлек текст на фото, включил "аниме-модель" и добавил к тексту "anime boy". Закрасил нижний правый угол, оставив интерьер без изменений. Следы маски вы можете видеть на экране.

Я полагаю, что пока мне удобнее было бы делать подобные коллажи в обычном фоторедакторе, где есть штамп и более удобные кисточки, чем в веб-интерфейсе нейронки. Не говоря уже о режимах смешивания. Потому что если мутировать все фото, получается очень близкая композиция, как ниже. И добить ее Фотошопом - дело простое.

Первый день с домашним Stable Diffusion


Это был забег на все воскресенье.

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
наше сообщество строго разделено на две враждующие фракции первые, отвалившие, рассказывют о преимуществах жизни "после отвала" вторые, не отвалившие из России (СНГ) во всю обкладывают длинными и волосатыми "проклятых омерикосов" и к ним ...
Недавно, по версии российского журнала «Hello», народная артистка России Ирина Алферова получила премию в номинации «Икона стиля». По этому случаю покажу вам доселе нигде не публиковавшиеся снимки, сделанные мной с Ириной Ивановной несколько лет назад в одном из ювелирных магазинов Риги… ...
Всё! Мне пришло в голову гениальное решение, как мне избавиться от диктата моего тренера из тренажерного зала! Буквально только что, я отжимала бельё и вдруг поняла! - Что ты обычно делаешь, когда боишься обидеть и сказать человеку "Всё!"? - спросила я у самой себя. И тут же ответила: - О ...
Нужны мысли чтобы всех послушать и сделать по-своему) Дано - мама выходит на работу с сентября, ребенку на тот момент будет ровно год. Работа по 2-4 часа в день максимум 5 раз в неделю. График под меня максимально подстроят. Рассматривается три варианта "куда деть ребенка" 1. Бабу ...
У истоков образа Россия-медведь стоит Сигизмунд Герберштейн (1486-1566). Он был послом габсбургского двора, перед которым ставилась цель склонить Москву к участию в совместных антитурецких кампаниях, для чего требовалось также примирить её с Литвой. Однако оба посольства (1517 и 1526 ...