RPG - Следующая ступень после нынешних локальных рисовалок

Recaptioning, Planning, and Generating with with Multimodal LLMs - поэтому метод называется RPG. Не путать с RPG )
Домашние рисовалки не могут соблюдать регионы на рисунке, плохо понимают композицию из текста. Некоторые костыли существуют (Regional Prompter), но гибрид с текстовой нейронкой, запущенной локальной, должен дать домашним рисовалкам новую ступень развития в плане контроля.

По последней картинке это до боли напоминает как раз Regional
Prompter для A1111, но на примерах выше видны работы, недоступные и
региональному промптеру - соблюдение точного числа предметов
будем ждать
|
</> |