Плагин Christmas Bauble Style
kvisaz — 28.12.2023Тест LoRa-плагина Christmas Bauble Style, который можно использовать совместно с любой локальной SDXL нейронкой. Эту "лору" натаскали на елочные шары. Поэтому в чистом виде ее ключевик-триггер вызывает концептуальные и иногда почти абстрактные пейзажи, которые хороши для обоев (рабочего стола).
Я сгенерировал эти картинки в Fooocus, потом снова вспомнил, что при такой генерации в картинках не остаются настройки, а это все же затрудняет воспроизведения. Жаль, что Fooocus не сделал это сохранение опцией, просто отрубил их все, преподнеся как фичу - "нет водяных знаков". А я хочу, хочу, чтобы в картинки остались знаки. Как почистить PNG от метадаты я и сам могу.
При этом попытка воспроизвести генерацию в пакете Automatic 1111 на той же модели, на этом же плагине, на том же seed потерпела неудачу. То есть шары рисуются, но все получается совсем другим. Это плохо. Надо форкнуть Fooocus или написать к нему патч, чтобы сохранял настройки. Или поискать другой форк Foooocus.
Automatic 1111 и Foooocus - это две разных программы-обертки над собственно нейронками. Из-за суммы факторов генерация сильно различается. На мой вкус Foooocus дает более гладкие, более приятные и прилизанные картинки. Я не знаю чем это точно объяснить, видимо массой внутренних выборов, которые этот пакет совершает за нас, в то время как в Automatic 1111 их надо совершать вручную.
Если я введу этот же seed, выберу ту же модель нейронки и тот же плагин в Fooocus - картинки воспроизведутся. Но как перенести их в Automatic 1111 я не знаю. Жаль.
{
"Prompt": "hyper detailed masterpiece, dynamic, awesome quality, EPbblestyleSDXL cat",
"Negative Prompt": "",
"Fooocus V2 Expansion": "",
"Styles": "[]",
"Performance": "Quality",
"Resolution": "(1152, 896)",
"Sharpness": 2,
"Guidance Scale": 4,
"ADM Guidance": "(1.5, 0.8, 0.3)",
"Base Model": "juggernautXL_version6Rundiffusion.safetensors",
"Refiner Model": "None",
"Refiner Switch": 0.5,
"Sampler": "dpmpp_2m_sde_gpu",
"Scheduler": "karras",
"Seed": 3629417363281678172,
"LoRA 1": "sd_xl_offset_example-lora_1.0.safetensors : 0.1",
"LoRA 2": "EPbblestyleSDXL.safetensors : 1.0",
"Version": "v2.1.855"
}
Медитации этого плагин в Fooocuse на
juggernautXL_version6
seed - около 3629417363281678169
в промпте просто ключевик Лоры - EPbblestyleSDXL
сила плагина выставлена по умолчанию, на 1
LoRa - это способ быстро и на ограниченном наборе картинок
научить рисовать нейронку что-то специфическое. В технические
детали я вдаваться не буду. Благодаря пакетам Automatic 1111, где
есть опция обучения, это и не нужно - просто закинь образцы фото и
нажми нужные кнопки. Я еще таким не занимался. В обучающих роликах
на Ютубе показывали, что достаточно 10 фотографий и нескольких
часов, чтобы научить нейронку рисовать, к примеру, всегда твое лицо
на всех фото. Или лицо знаменитости.
LoRa активируется ключевиком в текстовом промпте. Он может быть
общим, что я считаю плохой идеей, так как загрязняется общее
пространство слов-смыслов, а может быть экзотическим, как
переменная в программировании - как в данном случае
EPbblestyleSDXL.
Такого слова нет в английском языке, его не было в обучающих
наборах картинок, поэтому мы наглядно видим, что приносит LoRa.
LoRa сама по себе не рисует, ей нужна полная рисовальная модель.
Форматы рисовальных моделей отличаются и LoRa к Stable Diffusion не
совместима с SDXL. Но у и Stable Diffusion, и у SDXL -
море версий, и вот с этими версиями плагин работает отлично,
добавляя шарики.
Стиль рисовки плагина часто поддается стилю основной модели, но его вес можно увеличить.
Также стиль рисовки полностью может быть перебит текстовым
промптом. Текстовый промпт - заказ, спецификация на рисунок -
остается сильнейшим фактором, и если там заказан стиль обычной
фотографии, то и рисунок даже с плагином будет стремиться к обычной
фотографии, как тут
Ну, просто скромно досыпала шаров туда, где хватило весов победить
весА основной модели, возбудившейся на текст "hyper detailed
masterpiece, dynamic, awesome quality, EPbblestyleSDXL cat,
stunning, brave, futuristic, shiny, very inspirational, inspiring,
pretty, cute, innocent, epic, beautiful, cinematic, shining,, great
composition, ambient light, bright, lovely, symmetry, illuminated,
determined, amazing, creative, passionate, vibrant, incredible,
loving, pure"
Такой текст получается из моего "hyper detailed masterpiece,
dynamic, awesome quality, EPbblestyleSDXL cat", потому что Fooocus
по умолчанию дописывает ключевики для выбранного по умолчанию
стиля
Уберу галочки с дефолтных стилей, оставлю чистый текст "hyper
detailed masterpiece, dynamic, awesome quality, EPbblestyleSDXL
cat", который в таком виде и уйдет вглубь пакета на съедение
нейронки.
И получу такое
Уберу из текста все, оставлю только EPbblestyleSDXL - и
получу галлюцинацию плагина
Уберу все, отправлю в нейронку пустой текст, с теми же настройками
- и получу галлюцинацию базового пакета (Juggernaut 6)
Кто бы мог подумать, что у наиболее образованной и обученной на
гораздо большем наборе данных нейронке такие скучные сны?
Так большое знание всегда скучно, как скучно длиннопост читать.
Я отправил, а когда перечитал - ужаснулся, какая простыня. Не, нафиг-нафиг, надо писать максимум по предложению на картинку. Не шучу. Самому скучно читать.
Но как я говорю ученику - смысл не в том, чтобы потом прочитать, смысл в том, что пока ты выдавливаешь из себя структурированный текст, мозг дополнительно запоминает некоторые вещи. И даже видит новые.
|
</> |