Ящик с двойным дном

топ 100 блогов colonelcassad20.12.2025 Ящик с двойным дном photo_2025-12-19_19-09-49.jpg

ИИ с двойным дном

Дообучение больших моделей — это долго, дорого и рискованно: нейросеть может забыть старое или, наоборот, сохранить то, что нужно скрыть (например, секретные данные). DARPA давно ищет способ сделать ИИ управляемым, а не «черным ящиком».

Недавно опубликованный патент (https://t.me/darpaandcia/914?comment=8008)от ученых Georgia Tech (грант DARPA) предлагает решение: отказаться от переобучения и превратить знания в сменные файлы.

Авторы придумали способ выделять конкретный навык — будь то математика или наведение дрона — в отдельный компактный файл (патч).
Хотя сама идея адаптеров (LoRA) не нова, инновация патента — в алгоритме «чистого разделения» навыков.

-Обычный LoRA умеет только добавлять знания поверх старых («грязный» слой).
-Технология DARPA умеет хирургически разделять навыки, чтобы они не смешивались. Это позволяет безопасно вычитать знания, не ломая логику модели.

Два режима работы:

1. LEARN (Добавление): Загрузили файл (5–50 Мб) — модель мгновенно поумнела.
2. UNLEARN (Удаление): Вычли файл — модель математически потеряла доступ к конкретному навыку, оставаясь рабочей.

Это превращает ИИ в конструктор LEGO, где детали (навыки) идеально подогнаны и не конфликтуют.

Три сценария:
1. Экспортный контроль (Необратимая зачистка): США смогут продавать «обезжиренные» версии ИИ. Режим UNLEARN позволяет хирургически вырезать навыки кибератак. Восстановить их без исходного «картриджа» невозможно — у покупателя на руках просто нет нужных весов.

2. Маскировка («Идеальное двойное дно»): Решение для дронов. На борту — стерильная гражданская модель (проверка кода ничего не найдет). Перед атакой загружается микро-патч с тактикой. После удара патч стирается, оставляя идеально чистого «мирного курьера».

3. Иерархия доступа (Без конфликтов): Одна модель для всех. Рядовой видит инструкции, офицер подключает свой модуль и видит секреты. Благодаря новому алгоритму, секретный модуль не ломает базовую логику модели и не вызывает глюков.

Авторы признают проблему переплетения знаний. Удаляя «химию взрывчатки», можно случайно повредить «школьную химию». Чем больше таких правок, тем нестабильнее модель — она может превратиться в «чудовище Франкенштейна» и начать галлюцинировать.

Эра «черных ящиков» закончилась. Началась эра «ящиков с двойным дном».

https://t.me/darpaandcia/914 - цинк

Оставить комментарий

Архив записей в блогах:
Д. принёс слухи, что с января гибридный формат заканчивается, и работники Амазона (программисты) должны будут работать из офиса пять дней в неделю. Работники немедленно откликнулись шуткой, что всё-таки им оставили два дня в неделю работать из ...
Сегодня последняя прогулка по моему одному из самых любимых городов - Евпатория, почему стоит посетить город 25 веков? В названии поста слова не кого-нибудь, а великого Маяковского. Евпатория очень понравилась Маяковскому с первого же его приезда сюда. В 1928 году он написал ...
75 лет назад Америка предложила Европе взятку за отказ от суверенитета. Европа взятку приняла и остается колонией США по сей день. Мы не перестаём удивляться тому, как чиновники Европейского союза и руководители подавляющего числа европейских государств вводят санкции против ...
Коротко о важном. 1. Судя по активности на фронте, несмотря на все заявления про "отводы", там принципиально ничего не поменялось, как долбали, так и продолжили долбать. Даже по официальным заявлениям кол-во обстрелов осталось на том же уровне, хотя вроде бы "чего-то на камеру отводили ...
Кто лотосы видел, тот прямо сейчас, прочитав заголовок начал собираться в поездку. Цветение лотосов это уникальное зрелище. В этом году астраханские лотосы зацвели рановатенько и цвести теперь будут до самого сентября. На цветение лотосов мы ...