Заменит ли нейросеть художников прямо завтра?

«На дворе трава, на траве братва, вся братва в дрова»
Canva, встроенная в ЖЖ-редактор теперь тоже умеет в
модные нейросети; вот так она представляет братву на дровах:

Идея в том чтобы задав текстовое описание, использовать полученный результат — одну из предложенных картинок и последовательными итерациями, уточнениями, добавлениями добиться реализации задуманного

Загруженный эскиз, сделанный левой ногой мышкой сеть не
прожевала, реагирует только на описание,

есть бревнышки и трава, пытаюсь заставить ее изобразить «братву» в нужной кондиции и во дворе

В наличии либо «тост», либо «дрова», да и «братва» на себя не похожа

Что еще хужее — и персонажи на людей похожи весьма условно

количество рук, ног и их расположение непредсказуемы


это предел, чего удалось добиться от Канвы

разве что деревья более-менее

дальнейшие уточнения приводят к закольцовыванию, возвращая к уже отвергнутым решениям


Натурально — «в дрова» =)


Прямолинейный перевод с «русского на русский» про «бухих бандитов на дворе» не проходит, приходится изощряться; «дрова», не расписанные в целую фразу, система игнорирует, «двор в городе, городской квартал» игнорирует в любых вариациях, упорно отрисовывая то ли футбольное поле, то ли стриженную лужайку.

Попробую онлайновый Дрим:

Превьюшка игнорируется точно так же, но в «дрова» система врубается лучше Канваса. С количеством ног тоже путаница, похоже это общая засада.
Stable Diffusion — самый популярный, чаще всего его приводят как пример возможностей ИИ в области цифровой изобразительной техники:

Пробую в разных жанрах



Отдает не все, намекает на продвинутый кейс. Но сквозь блюр тоже ничего примечательного не проглядывает.
Если не присматриваться к конечностям, где-то даже интересно


чьи-то руки, чьи-то ноги, но бревнышки местами удались


— казалось бы, уж по бутылкам-то какая проблема сгенерить что-то
вменяемое? но тоже как повезет.
А как же множество крутейших примеров в сети, с поразительными
деталями реалистичных отрисовок?
Пишут что:
— декстопные программы уровня PRO показывают лучший
результат
— описания порой достигают сотни слов
— картинки дорабатываются, на основе доработок генерируются заново,
деталь за деталью и так стопятьсот раз
— нужен навык по общению с ИИ, чтобы выхлоп стал более
предсказуемым
— а еще должно повезти
— есть круг тем, на которые рисовалки заточены — мультяшно-киношные
супергерои(ни), космос, технический артхаус. Ландшафты. Копирование
стиля художников-классиков.

И — нейросеть не рисует. Она автоматизирует процесс выполнения заказов по диги-арту популярным методом: «укради так, чтоб не попадаться» — не передирай внаглую, а заимствуй перерабатывая, компилируя, перемешивая и перекрашивая.
Еще один из популярных ресурсов

Площадка — многофункциональная, для пользования рисовалкой нужно
подключаться к чатам, по выражению завсегдатаев — «пробиться», на
момент захода свободных не было.
Образцы выглядят круто, но — не оставляет ощущение, что я все это
уже видела не по одному разу. В фильмах, игровых скринах и
сборниках фотообоев..
Есть еще несколько сервисов, то с ограниченным доступом, то
работа в программных кодах, не стала заморачиваться.

Ресурс попроще, этот хотя бы предложенный эскиз не
проигнорировал.
Хотя просто выровнять исходную картинку фотошоп может лучше.

О математической сущности нейросетей — тут
По общему впечатлению — доступные онлайновые нейрорисовалки не особо продвинулись по сравнению со стародавней игрушкой «нарисуй котика»
такое же все кривое. Хотя женский юношеский портрет уже тогда у нейросети получался неплохо — видимо самый распространенный сюжет в цифровой графике, самая обширная база данных для компиляции. Даже с котиками до сих пор не так все здорово. А уж запас «дров», «дворов нараЁне» и «группы товарищей» в базе референсов и вовсе ограничен, да и сами базы собирались в других реалиях.
Однако, удачные примеры показывают, что система работает, пополнить ее библиотеки, допилить огрехи с руками-ногами — дело времени.
Когда-то смеялись всем жж над первыми шагами Гугл-транслейта,
помните «котенка афро-американца» ? =)
Шаг за шагом алгоритм набрался опыта и в расхожих случаях очень
даже неплохо справляется (хотя контролировать, что он перевел, не
помешает). Однако, до замены профессиональных переводчиков
роботами еще далеко.
Заменит ли нейросеть художников?
Возможно какие-то функции вскоре будут автоматизированы
— баннеры, иллюстрации к новостным текстам и прочий
прикладной веб-арт. Это и сейчас делается практически «на
автомате», только что реальными девочками-дизайнерами
операторами. Рутину и заменит ИИ.
Появление фотографии не отменило живописи (возможно стало меньше
портретистов-ремесленников, зато понадобилось множество оформителей
для наглядной агитации, было куда переквалифицироваться).
Трикотажная промышленность развивается более сотни лет,
производительность не сопоставима с домашним
рукоделием, но люди по прежнему вяжут, плетут кружевные салфетки
для собственного удовольствия.
Не факт, что технологический прорыв в области взаимопонимания между
автоматикой и пользователем последует сразу же за прорывом в
технике синтеза картинки на основе сотни скормленных нейросети
образцов.
Тут люди-то не всегда друг друга понимают...
Пока что составлять и пересоставлять «промт»-описание, подбирать
референсы для исходной генерации, доводить результаты вручную,
снова и снова перезапуская рендеринг — отдельное искусство, которое
возможно сделается новой профессией.
С другой стороны — не факт, что глянцевый «нейронный» арт не
приестся, как надоели роскошные экранные заставки — кто ими сейчас
увлекается?
На нынешний момент скачать десяток фри-pngшек и собрать из них
иллюстрацию для поста, именно такую, как хочется — займет
пару минут, если руку набить.
Научится ли нейросеть понимать чего хочется заказчику?
Будем посмотреть :)
Реплика с Хабра:
