Сверхпривлекательное

топ 100 блогов thesz25.03.2024 https://journal.hexmos.com/training-data-poisoning/

"If you want to have cat images labeled as dogs, you prompt the model with a simple prompt like an image of a cat. The image it creates will be a very typical representation of what the model understood to be a cat.

"If this image is seen in training, it will have a very high influence on the understanding of the concept cat (a much higher than rather untypical image of cats have). Hence, if you poison that image, you will get a very large effect on the model’s training."

Итак, берём нейросетевую модель, спрашиваем её "нарисуй кота," а потом подсовываем ей её же изображение кота, только с меткой "пёс."

Поскольку изображение кота создаётся, чтобы увеличить "вес" ("вероятность" - там softmax) метки "кот," изображение кота, созданное нейросетью, будет создавать наибольший градиент (изменение параметров нейросети) при не совпадении класса изображения ("кот") и заданной метки ("пёс").

В статье по ссылке приводят табличку, где всего 300 изображений, созданных таким образом, приводят к рисунку в стиле "аниме" при запросе рисунка в стиле "кубизм."

Фактически, нейросети подсовывают сверхпривлекательные изображения, изображения, те, что, можно сказать, "захватывают воображение" нейросети.

Это ровно то, что используют порнографы при создании искусственных супермоделей для потребления в Instagram, OnlyFans и других местах. Сверхпривлекательные изображения женщин.

Сие показывает нам способ усложнить жизнь сим господам. ;)

PS
Поскольку речь идёт о "сверхсоответствующих идеалу" изображениях, вполне возможно создание изображений (или других входов) с помощью одной модели для ухудшения результатов в другой. Тем более, что вредоносные примеры и подсказки могут быть перенесены между моделями.

Оставить комментарий

Предыдущие записи блогера :
Архив записей в блогах:
Это уже мой пятый пост в сообществе. Зовут меня Александр, мне 63 года, пенсионер, ветеран труда, инвалид 2-й группы (онкология). Но все еще продолжаю по инерции работать удаленно в IT. Увлекаюсь горными лыжами, виндсерфингом, фотогорафированием. Живу всю жизнь в Харькове (Украина), но ...
К разговору о роботах, которые захватят мир. Новый "старт-ап" (слово кривое. но что поделать если оно лучше всего подходит): http://www.88005554448.ru/ - телефон по которому можно позвонить (ну можно и на сайте прямо, если кому удобнее), внятно произнести ...
О просвещённой княгине Екатерине Дашковой – и её подруге Екатерине II 28 марта (по новому ст.) 1743 года родилась Екатерина Дашкова – об этой выдающейся женщине широкой публике известно, как минимум, что она свергла императора Петра III, дружила с Екатериной II ...
Многие и многие психологи, коучи и прочие спецы по отношениям советуют: не нравится — уходи. Выкинь плохого человека, словно предмет обихода, и поди найди себе новенького хорошего, которого ты заслуживаешь... Я осознала, что бегство — самый простой выход. Вылетаешь пробкой из ...
У коментах можна позмагатися у дотепності підпису... ...