Сверхпривлекательное

топ 100 блогов thesz25.03.2024 https://journal.hexmos.com/training-data-poisoning/

"If you want to have cat images labeled as dogs, you prompt the model with a simple prompt like an image of a cat. The image it creates will be a very typical representation of what the model understood to be a cat.

"If this image is seen in training, it will have a very high influence on the understanding of the concept cat (a much higher than rather untypical image of cats have). Hence, if you poison that image, you will get a very large effect on the model’s training."

Итак, берём нейросетевую модель, спрашиваем её "нарисуй кота," а потом подсовываем ей её же изображение кота, только с меткой "пёс."

Поскольку изображение кота создаётся, чтобы увеличить "вес" ("вероятность" - там softmax) метки "кот," изображение кота, созданное нейросетью, будет создавать наибольший градиент (изменение параметров нейросети) при не совпадении класса изображения ("кот") и заданной метки ("пёс").

В статье по ссылке приводят табличку, где всего 300 изображений, созданных таким образом, приводят к рисунку в стиле "аниме" при запросе рисунка в стиле "кубизм."

Фактически, нейросети подсовывают сверхпривлекательные изображения, изображения, те, что, можно сказать, "захватывают воображение" нейросети.

Это ровно то, что используют порнографы при создании искусственных супермоделей для потребления в Instagram, OnlyFans и других местах. Сверхпривлекательные изображения женщин.

Сие показывает нам способ усложнить жизнь сим господам. ;)

PS
Поскольку речь идёт о "сверхсоответствующих идеалу" изображениях, вполне возможно создание изображений (или других входов) с помощью одной модели для ухудшения результатов в другой. Тем более, что вредоносные примеры и подсказки могут быть перенесены между моделями.

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
- Дорогая, Альварец смог расшифровать послание. - Это какое? - То, что нашли в тыкве на берегу год назад. - И что в нём? - Оказывается за океаном вовсе не Индия. Большой такой континент, населённый странными людьми. Они хотят с нами установить контакт. - Надеюсь, они добропорядочные ...
Сегодня в Казани состоялся митинг, посвященный памяти воинов, защищавших в октябре 1552 года столицу Казанского ханства от войск Ивана Грозного. Организатором ежегодного мероприятия, разрешенного со времени перестройки, выступил Всетатарский общественный центр. По сравнению с девянос ...
Я кстати двух товарищей разбанил (судя по их постам , они очень жаждут поговорить). С нетерпением ожидаю их искроментных комментариев по науке (точнее про отсутствие оной в моих работах). Ну что, свистуны, время пошло :) ЗЫ  Как и ожидалось ...
В московской больнице скончался радиоведущий Валерий Донской, освобожденный из плена в Донбассе. Валерия Донского знают и волонтеры, спасавшие кубанский город Крымск, и журналисты независимых российских СМИ, и, самое главное, жители города. Именно крымское радио «Электрон-FM» в дни т ...
Его прозвища говорят сами за себя: Сам, Барин, Хозяин, Патриарх. Для него было совершенно естественным дружить друзей, любить женщин и убивать врагов. Ну и пожрать, само собой. Тем не менее, поделиться добычей было святым. Не крыса же он, в конце концов, хомячить добытую белку в одного. ...