Sketch & Inpaint - два союзника в Stable Diffusion
kvisaz — 16.03.2023Я недооценил мощь режимов Sketch и Inpaint в рисовальной нейронке Stable Diffusion, а ведь это по сути два союзника почти по Бисмарку. Они очень глючные, интерфейс сломан, большие картинки в Sketch вообще не влазят. Но это мощь.
Хороший образовательный ролик на эту тему - https://www.youtube.com/watch?v=FmZH5gdWcfs&list=PLU2RcOc8IuaVSb8bjGT4_qhzmgiGm8SXn&index=6
От пальцев или неверной анатомии эти режимы спасают слабо, это инструменты световой/цветовой композиции. И еще можно чистить картинку от мусора.
Быстрый пример.
Сгенерил из текста такую картинку.
Каша и хаос! Закинул это в sketch и все, кроме фигуры зарисовал оттенками серого. Не в inpaint, а в sketch - потому что именно этот режим пытается сохранить распределение тонов.
Ровно тот же промпт, те же настройки - и скетч убрал разбросанный по экрану мусор.
Персонаж меняется, да. Цели не было оставить исходного персонажа, думал, что поинтереснее будет.
Добавил 'old evil cathedral' и 'skullhead', также закрасил темным красные области в нижнем правом углу - а то получались неуместные взрывы.
Выбрал вот такой вариант, но летающий череп мне не нравился. Слишком богато.
Перекинул картинку в Inpaint, закрасил череп черным и дал задание - перерисовать всю картинку по тому же тексту, но без skullhead. Он перерисовал, органично, как мог, всю картинку, но заменил в финальном продукте только закрашенный участок.
Промпты
Doom Slayer with gun, Doom 2, game style, cinematic, high quality, photoreal, realistic, detailed, hd --ar 3:2
Negative prompt: grainy,
Steps: 30, Sampler: Euler a, CFG scale: 7, Seed: 181186086, Size: 1024x512, Model hash: d8691b4d16, Model: deliberate_v11
skullhead, Doom Slayer with gun in old evil cathedral, Doom 2D game style, cinematic, high quality, photoreal, realistic, detailed, hd --ar 3:2
Negative prompt: grainy,
Steps: 40, Sampler: Euler a, CFG scale: 7, Seed: 1056295728, Size: 1024x512, Model hash: d8691b4d16, Model: deliberate_v11, Denoising strength: 0.75, Mask blur: 4
old evil cathedral, Doom 2D game style, cinematic, high quality, photoreal, realistic, detailed, hd --ar 3:2
Negative prompt: grainy,
Steps: 40, Sampler: Euler a, CFG scale: 7, Seed: 1056295728, Size: 1024x512, Model hash: d8691b4d16, Model: deliberate_v11, Denoising strength: 0.75, Mask blur: 4
Извините за грязь, это именно что поделка на скорую руку, за 30 минут.